/[escript]/trunk/paso/src/SolverFCT.c
ViewVC logotype

Diff of /trunk/paso/src/SolverFCT.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

trunk/paso/src/Solver_FluxControl.c revision 1361 by gross, Fri Dec 14 09:26:51 2007 UTC trunk/paso/src/SolverFCT.c revision 1552 by gross, Thu May 8 08:52:41 2008 UTC
# Line 13  Line 13 
13    
14  /**************************************************************/  /**************************************************************/
15    
16  /* Paso: FluxControl                                          */  /* Paso: FCTransportProblem                                          */
17    
18  /**************************************************************/  /**************************************************************/
19    
# Line 26  Line 26 
26  #include "SolverFCT.h"  #include "SolverFCT.h"
27  #include "PasoUtil.h"  #include "PasoUtil.h"
28    
 #define FLUX_S(a,b) ((SIGN(a)+SIGN(b))/2.)  
 #define MINMOD(a,b) (FLUX_S(a,b)*MIN(ABS(a),ABS(b)))  
 #define SUPERBEE(a,b) (FLUX_S(a,b)*MAX(MIN(2*ABS(a),ABS(b)),MIN(ABS(a),2*ABS(b))))  
   
 #define FLUX_L(a,b) SUPERBEE(a,b)  /* alter for other flux limiter */  
   
 #define FLUX_LIMITER(a) FLUX_L(a,1)  
29    
30  /**************************************************************/  /**************************************************************/
31    
32  /* free all memory used by FluxControl                                */  /* free all memory used by                                */
33    void Paso_FCTransportProblem_free(Paso_FCTransportProblem* in) {
34         if (in!=NULL) {
35            in->reference_counter--;
36            if (in->reference_counter<=0) {
37               Paso_SystemMatrix_free(in->transport_matrix);
38               Paso_SystemMatrix_free(in->mass_matrix);
39               Paso_SystemMatrix_free(in->iteration_matrix);
40               Paso_MPIInfo_free(in->mpi_info);
41               MEMFREE(in->u);
42               MEMFREE(in->main_iptr);
43               MEMFREE(in->lumped_mass_matrix);
44               MEMFREE(in->main_diagonal_low_order_transport_matrix);
45               MEMFREE(in);
46            }
47        }
48    }
49    
50  void Paso_Solver_FluxControl_free(Paso_Solver_FluxControl* in) {  Paso_FCTransportProblem* Paso_FCTransportProblem_getReference(Paso_FCTransportProblem* in) {
51       if (in!=NULL) {       if (in!=NULL) {
52          Paso_SystemMatrix_freeBuffer(in->matrix);          ++(in->reference_counter);
         Paso_SystemMatrix_free(in->matrix);  
         MEMFREE(in->colorOf);  
         MEMFREE(in->main_iptr);  
         MEMFREE(in);  
53       }       }
54         return in;
55    }    
56    
57    Paso_SystemMatrix* Paso_FCTransportProblem_borrowTransportMatrix(Paso_FCTransportProblem* in) {
58       return in->transport_matrix;
59    }
60    Paso_SystemMatrix* Paso_FCTransportProblem_borrowMassMatrix(Paso_FCTransportProblem* in) {
61       return in->mass_matrix;
62  }  }
63    
64  /**************************************************************/  double* Paso_FCTransportProblem_borrowLumpedMassMatrix(Paso_FCTransportProblem* in) {
65        return in->lumped_mass_matrix;
66    }
67    
68    dim_t Paso_FCTransportProblem_getTotalNumRows(Paso_FCTransportProblem* in) {
69        return Paso_SystemMatrix_getTotalNumRows(in->transport_matrix);
70    }
71    
72  /*   constructs a flux control mechanism                      */  Paso_FCTransportProblem* Paso_FCTransportProblem_alloc(double theta, Paso_SystemMatrixPattern *pattern, int block_size
73    
 Paso_Solver_FluxControl* Paso_SolverFCT_getFluxControl(Paso_SystemMatrix * A) {  
74    
75    Paso_Solver_FluxControl* out=NULL;  ) {
76    dim_t n,i;       Paso_SystemMatrixType matrix_type=MATRIX_FORMAT_DEFAULT+MATRIX_FORMAT_BLK1;  /* at the moment only block size 1 is supported */
77    index_t iptr,iptr_main,k;       Paso_FCTransportProblem* out=NULL;
78         dim_t n,i;
79    if (A==NULL) return out;       index_t iptr,iptr_main,k;
80    n=Paso_SystemMatrix_getTotalNumRows(A);  
81    if (A->block_size!=1) {       if ((theta<0.) || (theta >1.)) {
82          Paso_setError(TYPE_ERROR,"Paso_SolverFCT_getFluxControl: block size > 1 is not supported.");          Paso_setError(TYPE_ERROR,"Paso_FCTransportProblem_alloc: theta needs to be between 0. and. 1.");
83          return NULL;          return NULL;
84    }       }
   out=MEMALLOC(1,Paso_Solver_FluxControl);  
   if (Paso_checkPtr(out)) return NULL;  
85    
86    out->matrix=Paso_SystemMatrix_reference(A);       out=MEMALLOC(1,Paso_FCTransportProblem);
87    out->colorOf=NULL;       if (Paso_checkPtr(out)) return NULL;
88    out->main_iptr=NULL;  
89      
90         out->theta=theta;
91    /* allocations: */         out->dt_max=LARGE_POSITIVE_FLOAT;
92    out->colorOf=MEMALLOC(n,index_t);       out->valid_matrices=FALSE;
93    out->main_iptr=MEMALLOC(n,index_t);       out->transport_matrix=Paso_SystemMatrix_alloc(matrix_type,pattern,block_size,block_size);
94    if ( ! (Paso_checkPtr(out->colorOf) || Paso_checkPtr(out->main_iptr) ) ) {       out->mass_matrix=Paso_SystemMatrix_alloc(matrix_type,pattern,block_size,block_size);
95        printf("Paso_SolverFCT_getFluxControl: Revise coloring!!\n");       out->iteration_matrix=NULL;
96        Paso_Pattern_color(A->mainBlock->pattern,&(out->num_colors),out->colorOf);  
97        Paso_SystemMatrix_allocBuffer(A);       out->mpi_info=Paso_MPIInfo_getReference(pattern->mpi_info);
98         out->u=NULL;
99        #pragma omp parallel for schedule(static) private(i,iptr,iptr_main,k)       out->u_min=0.;
100        for (i = 0; i < n; ++i) {       out->main_iptr=NULL;
101          for (iptr=A->mainBlock->pattern->ptr[i];iptr<A->mainBlock->pattern->ptr[i+1]; ++iptr) {       out->lumped_mass_matrix=NULL;
102               iptr_main=A->mainBlock->pattern->ptr[0]-1;       out->main_diagonal_low_order_transport_matrix=NULL;
103                for (iptr=A->mainBlock->pattern->ptr[i];iptr<A->mainBlock->pattern->ptr[i+1]; iptr++) {  
104                     if (A->mainBlock->pattern->index[iptr]==i) {       if (Paso_noError()) {
105                          iptr_main=iptr;           n=Paso_SystemMatrix_getTotalNumRows(out->transport_matrix);
106                          break;  
107                     }           out->u=MEMALLOC(n,double);
108                 }           out->main_iptr=MEMALLOC(n,index_t);
109                 out->main_iptr[i]=iptr_main;           out->lumped_mass_matrix=MEMALLOC(n,double);
110                 if (iptr_main==A->mainBlock->pattern->ptr[0]-1)           out->main_diagonal_low_order_transport_matrix=MEMALLOC(n,double);
111                    Paso_setError(VALUE_ERROR, "Paso_SolverFCT_getFluxControl: no main diagonal");  
112             }           if ( ! (Paso_checkPtr(out->u) || Paso_checkPtr(out->main_iptr) ||
113         }                   Paso_checkPtr(out->lumped_mass_matrix) || Paso_checkPtr(out->main_diagonal_low_order_transport_matrix))  ) {
114                
115                 #pragma omp parallel for schedule(static) private(i)
116                 for (i = 0; i < n; ++i) {
117                    out->lumped_mass_matrix[i]=0.;
118                    out->main_diagonal_low_order_transport_matrix[i]=0.;
119                    out->u[i]=0.;
120                 }
121                 /* identify the main diagonals */
122                 #pragma omp parallel for schedule(static) private(i,iptr,iptr_main,k)
123                 for (i = 0; i < n; ++i) {
124                        iptr_main=pattern->mainPattern->ptr[0]-1;
125                        for (iptr=pattern->mainPattern->ptr[i];iptr<pattern->mainPattern->ptr[i+1]; iptr++) {
126                              if (pattern->mainPattern->index[iptr]==i) {
127                                   iptr_main=iptr;
128                                   break;
129                              }
130                        }
131                        out->main_iptr[i]=iptr_main;
132                        if (iptr_main==pattern->mainPattern->ptr[0]-1)
133                             Paso_setError(VALUE_ERROR, "Paso_FCTransportProblem_alloc: no main diagonal");
134                 }
135    
136          }
137    
138    }    }
139    if (Paso_noError()) {    if (Paso_noError()) {
140       return out;       return out;
141    } else {    } else {
142       Paso_Solver_FluxControl_free(out);       Paso_FCTransportProblem_free(out);
143       return NULL;       return NULL;
144    }    }
145  }  }
146    
147  /**************************************************************/  void Paso_FCTransportProblem_checkinSolution(Paso_FCTransportProblem* in, double* u) {
148        dim_t i, n;
149  /* adds A plus stabelising diffusion into the matrix B        */      double local_u_min,u_min;
150      
151  /* d_ij=alpha*max(0,-a[i,j],-a[j,i])  */      n=Paso_FCTransportProblem_getTotalNumRows(in);
152  /* b[i,j]+=alpha*(a[i,j]+d_ij)  */      u_min=LARGE_POSITIVE_FLOAT;
153  /* b[j,i]+=alpha*(a[j,i]+d_ij)  */      #pragma omp parallel private(local_u_min)
154  /* b[i,i]-=alpha*d_ij  */      {
155  /* b[j,j]-=alpha*d_ij  */           local_u_min=0.;
156             #pragma omp for schedule(static) private(i)
157  void Paso_Solver_FluxControl_addDiffusion(Paso_Solver_FluxControl * fc, double alpha, Paso_SystemMatrix * B) {           for (i=0;i<n;++i) local_u_min=MIN(local_u_min,u[i]);
158    dim_t n,i;           #pragma omp critical
159    index_t color, iptr_ij,j,iptr_ji;           {
160    register double d_ij;              u_min=MIN(u_min,local_u_min);
161             }
162    if (fc==NULL) return;      }
163    n=Paso_SystemMatrix_getTotalNumRows(fc->matrix);      #ifdef PASO_MPI
164    /* TODO test - same pattern + block size */           local_u_min=u_min;
165             MPI_Allreduce(&local_u_min,&u_min, 1, MPI_DOUBLE, MPI_MIN, in->mpi_info->comm);
166    #pragma omp parallel private(color)      #endif
167    {      in->u_min=u_min;
168         /* process main block */      #pragma omp parallel for schedule(static) private(i)
169         for (color=0;color<fc->num_colors;++color) {      for (i=0;i<n;++i) {
170             #pragma omp for private(i,iptr_ij,j,iptr_ji,d_ij)  schedule(static)          in->u[i]=u[i]-u_min;
171             for (i = 0; i < n; ++i) {      }
                if (fc->colorOf[i]==color) {  
                   for (iptr_ij=fc->matrix->mainBlock->pattern->ptr[i];iptr_ij<fc->matrix->mainBlock->pattern->ptr[i+1]; ++iptr_ij) {  
                      j=fc->matrix->mainBlock->pattern->index[iptr_ij];  
                      if (i<j) {  
                         /* find entry a[j,i] */  
                         for (iptr_ji=fc->matrix->mainBlock->pattern->ptr[i];iptr_ji<fc->matrix->mainBlock->pattern->ptr[j+1]-1; ++iptr_ji) {  
                             if (fc->matrix->mainBlock->pattern->index[iptr_ji]==i) {  
                                 d_ij=(-alpha)*MIN3(0.,fc->matrix->mainBlock->val[iptr_ij],fc->matrix->mainBlock->val[iptr_ji]);  
                                 B->mainBlock->val[iptr_ij]+=alpha*fc->matrix->mainBlock->val[iptr_ij]+d_ij;  
                                 B->mainBlock->val[iptr_ji]+=alpha*fc->matrix->mainBlock->val[iptr_ji]+d_ij;  
                                 B->mainBlock->val[fc->main_iptr[i]]-=d_ij;  
                                 B->mainBlock->val[fc->main_iptr[j]]-=d_ij;  
                                 break;  
                             }  
                         }  
                      }  
                           
                   }  
                   /* TODO process couple block */  
                }  
            }  
            #pragma omp barrier  
        }  
   }  
   
 }  
 /**************************************************************/  
   
 /* adds antidiffusion to fa    
   
    P_p[i] + = sum_j min(0,a[i,j]) min(0,u[j]-u[i])    
    P_n[i] + = sum_j min(0,a[i,j]) max(0,u[j]-u[i])    
    Q_p[i] + = sum_j max(0,a[i,j]) max(0,u[j]-u[i])    
    Q_n[i] + = sum_j max(0,a[i,j]) min(0,u[j]-u[i])    
    d_ij=max(0,-a[i,j],-a[j,i])  
    l_ji=max(0,a[j,i],a[j,i]-a[i,j])  
    if a[j,i] >= a[i,j] and 0>a[i,j] : (i.e d_ij>0 and l_ji>=l_ij)  
       r_ij = u[i]>u[j] ? Q_p[i]/P_p[i] : Q_n[i]/Q_n[i]  
       f_ij =min(FLUX_LIMITER(r_ij)*d_ij,l_ji) (u[i]-u[j])=min(FLUX_LIMITER(r_ij)*a[i,j],a[j,i]-a[i,j]) (u[i]-u[j])  
       fa[i]+=f_ij  
       fa[j]-=f_ij  
   
 */  
   
 void Paso_Solver_FluxControl_setAntiDiffusiveFlux(Paso_Solver_FluxControl * fc, double * u, double* fa) {  
   
   register double u_i,P_p,P_n,Q_p,Q_n,r_p,r_n, a_ij, d, u_j, r_ij, f_ij, a_ji;  
   double *u_remote=NULL;  
   index_t color, iptr_ij,j,iptr_ji, i;  
   dim_t n;  
   
   
   if (fc==NULL) return;  
   n=Paso_SystemMatrix_getTotalNumRows(fc->matrix);  
   /* exchange */  
   Paso_SystemMatrix_startCollect(fc->matrix,u);  
   u_remote=Paso_SystemMatrix_finishCollect(fc->matrix);  
   
   #pragma omp parallel private(color)  
   {  
        for (color=0;color<fc->num_colors;++color) {  
            #pragma omp for schedule(static) private(i, u_i,P_p,P_n,Q_p,Q_n,r_p,r_n,iptr_ij,a_ij,d,j,iptr_ji, u_j, r_ij, f_ij, a_ji)  
            for (i = 0; i < n; ++i) {  
               if (fc->colorOf[i]==color) {  
                   u_i=u[i];  
                   /* gather the smoothness sensor */  
                   P_p=0.;  
                   P_n=0.;  
                   Q_p=0.;  
                   Q_n=0.;  
                   #pragma ivdep  
               for (iptr_ij=(fc->matrix->mainBlock->pattern->ptr[i]);iptr_ij<(fc->matrix->mainBlock->pattern->ptr[i+1]); ++iptr_ij) {  
                       a_ij=fc->matrix->mainBlock->val[iptr_ij];  
                       j=fc->matrix->mainBlock->pattern->index[iptr_ij];  
                       d=u[j]-u_i;  
                       if (a_ij<0.) {  
                          if (d<0.) {  
                             P_p+=a_ij*d;  
                          } else {  
                             P_n+=a_ij*d;  
                          }  
                       } else {  
                          if (d>0.) {  
                             Q_p+=a_ij*d;  
                          } else {  
                             Q_n+=a_ij*d;  
                          }  
                       }  
               }  
                   #pragma ivdep  
               for (iptr_ij=(fc->matrix->coupleBlock->pattern->ptr[i]);iptr_ij<(fc->matrix->coupleBlock->pattern->ptr[i+1]); ++iptr_ij) {  
                       a_ij=fc->matrix->coupleBlock->val[iptr_ij];  
                       j=fc->matrix->coupleBlock->pattern->index[iptr_ij];  
                       d=u_remote[j]-u_i;  
                       if (a_ij<0.) {  
                          if (d<0.) {  
                             P_p+=a_ij*d;  
                          } else {  
                             P_n+=a_ij*d;  
                          }  
                       } else {  
                          if (d>0.) {  
                             Q_p+=a_ij*d;  
                          } else {  
                             Q_n+=a_ij*d;  
                          }  
                       }  
               }  
                   /* set the smoothness indicators */  
                   r_p = (P_p > 0.) ? FLUX_LIMITER(Q_p/P_p) : 0.;  
                   r_n = (P_n < 0 ) ? FLUX_LIMITER(Q_n/P_n) : 0.;  
                   /* anti diffusive flux from main block */  
                   for (iptr_ij=fc->matrix->mainBlock->pattern->ptr[i];iptr_ij<fc->matrix->mainBlock->pattern->ptr[i+1]; ++iptr_ij) {  
                      a_ij=fc->matrix->mainBlock->val[iptr_ij];  
                      j=fc->matrix->mainBlock->pattern->index[iptr_ij];  
                      if (a_ij < 0 && i!=j) {  
                         /* find entry a[j,i] */  
                         for (iptr_ji=fc->matrix->mainBlock->pattern->ptr[i];iptr_ji<fc->matrix->mainBlock->pattern->ptr[j+1]-1; ++iptr_ji) {  
                             if (fc->matrix->mainBlock->pattern->index[iptr_ji]==i) {  
                                 a_ji=fc->matrix->mainBlock->val[iptr_ji];  
                                 if  (a_ji > a_ij || (a_ji == a_ij && j<i) ) {  
                                     u_j=u[j];  
                                     r_ij = u_i>u_j ? r_p : r_n;  
                                     f_ij =MIN(r_ij*a_ij,a_ji-a_ij)*(u_i-u_j);  
                                     fa[i]+=f_ij;  
                                     fa[j]-=f_ij;  
                                     break;  
                                 }  
                             }  
                         }  
                      }  
                   }  
                   /* anti diffusive flux from couple block */  
   
                   /* TODO */  
               }  
            }  
            #pragma omp barrier  
        }  
   }  
172  }  }

Legend:
Removed from v.1361  
changed lines
  Added in v.1552

  ViewVC Help
Powered by ViewVC 1.1.26