/[escript]/trunk/paso/src/SolverFCT_FluxControl.c
ViewVC logotype

Diff of /trunk/paso/src/SolverFCT_FluxControl.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

trunk/paso/src/Solver_FluxControl.c revision 1361 by gross, Fri Dec 14 09:26:51 2007 UTC trunk/paso/src/SolverFCT_FluxControl.c revision 1401 by gross, Fri Jan 25 04:31:18 2008 UTC
# Line 29  Line 29 
29  #define FLUX_S(a,b) ((SIGN(a)+SIGN(b))/2.)  #define FLUX_S(a,b) ((SIGN(a)+SIGN(b))/2.)
30  #define MINMOD(a,b) (FLUX_S(a,b)*MIN(ABS(a),ABS(b)))  #define MINMOD(a,b) (FLUX_S(a,b)*MIN(ABS(a),ABS(b)))
31  #define SUPERBEE(a,b) (FLUX_S(a,b)*MAX(MIN(2*ABS(a),ABS(b)),MIN(ABS(a),2*ABS(b))))  #define SUPERBEE(a,b) (FLUX_S(a,b)*MAX(MIN(2*ABS(a),ABS(b)),MIN(ABS(a),2*ABS(b))))
32    #define MC(a,b) (FLUX_S(a,b)*MIN3(ABS((a)+(b))/2,2*ABS(a),2*ABS(b)))
33    
34  #define FLUX_L(a,b) SUPERBEE(a,b)  /* alter for other flux limiter */  #define FLUX_L(a,b) MC(a,b)  /* alter for other flux limiter */
35    
36  #define FLUX_LIMITER(a) FLUX_L(a,1)  #define FLUX_LIMITER(a) FLUX_L(1,a)
   
 /**************************************************************/  
   
 /* free all memory used by FluxControl                                */  
   
 void Paso_Solver_FluxControl_free(Paso_Solver_FluxControl* in) {  
      if (in!=NULL) {  
         Paso_SystemMatrix_freeBuffer(in->matrix);  
         Paso_SystemMatrix_free(in->matrix);  
         MEMFREE(in->colorOf);  
         MEMFREE(in->main_iptr);  
         MEMFREE(in);  
      }  
 }  
   
 /**************************************************************/  
   
 /*   constructs a flux control mechanism                      */  
   
 Paso_Solver_FluxControl* Paso_SolverFCT_getFluxControl(Paso_SystemMatrix * A) {  
   
   Paso_Solver_FluxControl* out=NULL;  
   dim_t n,i;  
   index_t iptr,iptr_main,k;  
   
   if (A==NULL) return out;  
   n=Paso_SystemMatrix_getTotalNumRows(A);  
   if (A->block_size!=1) {  
         Paso_setError(TYPE_ERROR,"Paso_SolverFCT_getFluxControl: block size > 1 is not supported.");  
         return NULL;  
   }  
   out=MEMALLOC(1,Paso_Solver_FluxControl);  
   if (Paso_checkPtr(out)) return NULL;  
   
   out->matrix=Paso_SystemMatrix_reference(A);  
   out->colorOf=NULL;  
   out->main_iptr=NULL;  
     
   
   /* allocations: */    
   out->colorOf=MEMALLOC(n,index_t);  
   out->main_iptr=MEMALLOC(n,index_t);  
   if ( ! (Paso_checkPtr(out->colorOf) || Paso_checkPtr(out->main_iptr) ) ) {  
       printf("Paso_SolverFCT_getFluxControl: Revise coloring!!\n");  
       Paso_Pattern_color(A->mainBlock->pattern,&(out->num_colors),out->colorOf);  
       Paso_SystemMatrix_allocBuffer(A);  
   
       #pragma omp parallel for schedule(static) private(i,iptr,iptr_main,k)  
       for (i = 0; i < n; ++i) {  
         for (iptr=A->mainBlock->pattern->ptr[i];iptr<A->mainBlock->pattern->ptr[i+1]; ++iptr) {  
              iptr_main=A->mainBlock->pattern->ptr[0]-1;  
               for (iptr=A->mainBlock->pattern->ptr[i];iptr<A->mainBlock->pattern->ptr[i+1]; iptr++) {  
                    if (A->mainBlock->pattern->index[iptr]==i) {  
                         iptr_main=iptr;  
                         break;  
                    }  
                }  
                out->main_iptr[i]=iptr_main;  
                if (iptr_main==A->mainBlock->pattern->ptr[0]-1)  
                   Paso_setError(VALUE_ERROR, "Paso_SolverFCT_getFluxControl: no main diagonal");  
            }  
        }  
   
   }  
   if (Paso_noError()) {  
      return out;  
   } else {  
      Paso_Solver_FluxControl_free(out);  
      return NULL;  
   }  
 }  
37    
38  /**************************************************************/  /**************************************************************/
39    
# Line 115  Paso_Solver_FluxControl* Paso_SolverFCT_ Line 45  Paso_Solver_FluxControl* Paso_SolverFCT_
45  /* b[i,i]-=alpha*d_ij  */  /* b[i,i]-=alpha*d_ij  */
46  /* b[j,j]-=alpha*d_ij  */  /* b[j,j]-=alpha*d_ij  */
47    
48  void Paso_Solver_FluxControl_addDiffusion(Paso_Solver_FluxControl * fc, double alpha, Paso_SystemMatrix * B) {  void Paso_FCTransportProblem_addAdvectivePart(Paso_FCTransportProblem * fc, double alpha) {
49    dim_t n,i;    dim_t n,i;
50    index_t color, iptr_ij,j,iptr_ji;    index_t color, iptr_ij,j,iptr_ji;
51    register double d_ij;    register double d_ij, sum;
52    
53    if (fc==NULL) return;    if (fc==NULL) return;
54    n=Paso_SystemMatrix_getTotalNumRows(fc->matrix);    n=Paso_SystemMatrix_getTotalNumRows(fc->flux_matrix);
   /* TODO test - same pattern + block size */  
55    
56    #pragma omp parallel private(color)    #pragma omp parallel for private(i,iptr_ij,j,iptr_ji,d_ij,sum)  schedule(static)
57    {    for (i = 0; i < n; ++i) {
58         /* process main block */       sum=alpha*fc->flux_matrix->mainBlock->val[fc->main_iptr[i]];
59         for (color=0;color<fc->num_colors;++color) {       for (iptr_ij=fc->flux_matrix->mainBlock->pattern->ptr[i];iptr_ij<fc->flux_matrix->mainBlock->pattern->ptr[i+1]; ++iptr_ij) {
60             #pragma omp for private(i,iptr_ij,j,iptr_ji,d_ij)  schedule(static)           j=fc->flux_matrix->mainBlock->pattern->index[iptr_ij];
61             for (i = 0; i < n; ++i) {           if (j!=i) {
62                 if (fc->colorOf[i]==color) {               /* find entry a[j,i] */
63                    for (iptr_ij=fc->matrix->mainBlock->pattern->ptr[i];iptr_ij<fc->matrix->mainBlock->pattern->ptr[i+1]; ++iptr_ij) {               for (iptr_ji=fc->flux_matrix->mainBlock->pattern->ptr[j]; iptr_ji<fc->flux_matrix->mainBlock->pattern->ptr[j+1]; ++iptr_ji) {
64                       j=fc->matrix->mainBlock->pattern->index[iptr_ij];                  if (fc->flux_matrix->mainBlock->pattern->index[iptr_ji]==i) {
65                       if (i<j) {                      d_ij=(-alpha)*MIN3(0.,fc->flux_matrix->mainBlock->val[iptr_ij],
66                          /* find entry a[j,i] */                                            fc->flux_matrix->mainBlock->val[iptr_ji]);
67                          for (iptr_ji=fc->matrix->mainBlock->pattern->ptr[i];iptr_ji<fc->matrix->mainBlock->pattern->ptr[j+1]-1; ++iptr_ji) {                      fc->transport_matrix->mainBlock->val[iptr_ij]+=
68                              if (fc->matrix->mainBlock->pattern->index[iptr_ji]==i) {                                           alpha*fc->flux_matrix->mainBlock->val[iptr_ij]+d_ij;
69                                  d_ij=(-alpha)*MIN3(0.,fc->matrix->mainBlock->val[iptr_ij],fc->matrix->mainBlock->val[iptr_ji]);                      sum-=d_ij;
70                                  B->mainBlock->val[iptr_ij]+=alpha*fc->matrix->mainBlock->val[iptr_ij]+d_ij;                      break;
71                                  B->mainBlock->val[iptr_ji]+=alpha*fc->matrix->mainBlock->val[iptr_ji]+d_ij;                  }
72                                  B->mainBlock->val[fc->main_iptr[i]]-=d_ij;               }
73                                  B->mainBlock->val[fc->main_iptr[j]]-=d_ij;           }
74                                  break;       }
75                              }       /* TODO process couple block */
76                          }  
77                       }       /* update main diagonal */
78                                 fc->transport_matrix->mainBlock->val[fc->main_iptr[i]]+=sum;
                   }  
                   /* TODO process couple block */  
                }  
            }  
            #pragma omp barrier  
        }  
79    }    }
80    
81  }  }
82    
83    void Paso_FCTransportProblem_setFlux(Paso_FCTransportProblem * fc, double * u, double* fa) {
84      /*
85       *   sets fa=transport_matrix*u+anti-diffuison_flux(u)
86       */
87    
88      double *remote_u=NULL;
89      
90      if (fc==NULL) return;
91      Paso_SystemMatrix_startCollect(fc->transport_matrix,u);
92      /* process main block */
93      Paso_SparseMatrix_MatrixVector_CSR_OFFSET0(1.,fc->transport_matrix->mainBlock,u,0.,fa);
94      /* finish exchange */
95      remote_u=Paso_SystemMatrix_finishCollect(fc->transport_matrix);
96      /* process couple block */
97      Paso_SparseMatrix_MatrixVector_CSR_OFFSET0(1.,fc->transport_matrix->coupleBlock,remote_u,1.,fa);
98    
99      Paso_FCTransportProblem_setAntiDiffusiveFlux(fc,u,remote_u,fa);
100    }
101  /**************************************************************/  /**************************************************************/
102    
103  /* adds antidiffusion to fa    /* adds antidiffusion to fa  
# Line 174  void Paso_Solver_FluxControl_addDiffusio Line 116  void Paso_Solver_FluxControl_addDiffusio
116    
117  */  */
118    
119  void Paso_Solver_FluxControl_setAntiDiffusiveFlux(Paso_Solver_FluxControl * fc, double * u, double* fa) {  void Paso_FCTransportProblem_setAntiDiffusiveFlux(Paso_FCTransportProblem * fc, double * u, double *u_remote, double* fa) {
120    
121    register double u_i,P_p,P_n,Q_p,Q_n,r_p,r_n, a_ij, d, u_j, r_ij, f_ij, a_ji;    register double u_i,P_p,P_n,Q_p,Q_n,r_p,r_n, a_ij, d, u_j, r_ij, f_ij, a_ji, d_ij, sum;
   double *u_remote=NULL;  
122    index_t color, iptr_ij,j,iptr_ji, i;    index_t color, iptr_ij,j,iptr_ji, i;
123    dim_t n;    dim_t n;
124    
125    
126    if (fc==NULL) return;    if (fc==NULL) return;
127    n=Paso_SystemMatrix_getTotalNumRows(fc->matrix);    n=Paso_SystemMatrix_getTotalNumRows(fc->flux_matrix);
128    /* exchange */  
   Paso_SystemMatrix_startCollect(fc->matrix,u);  
   u_remote=Paso_SystemMatrix_finishCollect(fc->matrix);  
129    
130    #pragma omp parallel private(color)    #pragma omp parallel
131    {    {
132         for (color=0;color<fc->num_colors;++color) {        /*
133             #pragma omp for schedule(static) private(i, u_i,P_p,P_n,Q_p,Q_n,r_p,r_n,iptr_ij,a_ij,d,j,iptr_ji, u_j, r_ij, f_ij, a_ji)         * calculate the smootness sensors
134             for (i = 0; i < n; ++i) {        */
135                if (fc->colorOf[i]==color) {        #pragma omp for schedule(static) private(i, u_i,P_p,P_n,Q_p,Q_n,iptr_ij,a_ij,j,d)
136                    u_i=u[i];        for (i = 0; i < n; ++i) {
137                    /* gather the smoothness sensor */            u_i=u[i];
138                    P_p=0.;            P_p=0.;
139                    P_n=0.;            P_n=0.;
140                    Q_p=0.;            Q_p=0.;
141                    Q_n=0.;            Q_n=0.;
142                    #pragma ivdep            #pragma ivdep
143                for (iptr_ij=(fc->matrix->mainBlock->pattern->ptr[i]);iptr_ij<(fc->matrix->mainBlock->pattern->ptr[i+1]); ++iptr_ij) {        for (iptr_ij=(fc->flux_matrix->mainBlock->pattern->ptr[i]);iptr_ij<(fc->flux_matrix->mainBlock->pattern->ptr[i+1]); ++iptr_ij) {
144                        a_ij=fc->matrix->mainBlock->val[iptr_ij];                 a_ij=fc->flux_matrix->mainBlock->val[iptr_ij];
145                        j=fc->matrix->mainBlock->pattern->index[iptr_ij];                 j=fc->flux_matrix->mainBlock->pattern->index[iptr_ij];
146                        d=u[j]-u_i;                 d=u[j]-u_i;
147                        if (a_ij<0.) {                 if (a_ij<0.) {
148                           if (d<0.) {                    if (d<0.) {
149                              P_p+=a_ij*d;                        P_p+=a_ij*d;
150                           } else {                    } else {
151                              P_n+=a_ij*d;                        P_n+=a_ij*d;
                          }  
                       } else {  
                          if (d>0.) {  
                             Q_p+=a_ij*d;  
                          } else {  
                             Q_n+=a_ij*d;  
                          }  
                       }  
               }  
                   #pragma ivdep  
               for (iptr_ij=(fc->matrix->coupleBlock->pattern->ptr[i]);iptr_ij<(fc->matrix->coupleBlock->pattern->ptr[i+1]); ++iptr_ij) {  
                       a_ij=fc->matrix->coupleBlock->val[iptr_ij];  
                       j=fc->matrix->coupleBlock->pattern->index[iptr_ij];  
                       d=u_remote[j]-u_i;  
                       if (a_ij<0.) {  
                          if (d<0.) {  
                             P_p+=a_ij*d;  
                          } else {  
                             P_n+=a_ij*d;  
                          }  
                       } else {  
                          if (d>0.) {  
                             Q_p+=a_ij*d;  
                          } else {  
                             Q_n+=a_ij*d;  
                          }  
                       }  
               }  
                   /* set the smoothness indicators */  
                   r_p = (P_p > 0.) ? FLUX_LIMITER(Q_p/P_p) : 0.;  
                   r_n = (P_n < 0 ) ? FLUX_LIMITER(Q_n/P_n) : 0.;  
                   /* anti diffusive flux from main block */  
                   for (iptr_ij=fc->matrix->mainBlock->pattern->ptr[i];iptr_ij<fc->matrix->mainBlock->pattern->ptr[i+1]; ++iptr_ij) {  
                      a_ij=fc->matrix->mainBlock->val[iptr_ij];  
                      j=fc->matrix->mainBlock->pattern->index[iptr_ij];  
                      if (a_ij < 0 && i!=j) {  
                         /* find entry a[j,i] */  
                         for (iptr_ji=fc->matrix->mainBlock->pattern->ptr[i];iptr_ji<fc->matrix->mainBlock->pattern->ptr[j+1]-1; ++iptr_ji) {  
                             if (fc->matrix->mainBlock->pattern->index[iptr_ji]==i) {  
                                 a_ji=fc->matrix->mainBlock->val[iptr_ji];  
                                 if  (a_ji > a_ij || (a_ji == a_ij && j<i) ) {  
                                     u_j=u[j];  
                                     r_ij = u_i>u_j ? r_p : r_n;  
                                     f_ij =MIN(r_ij*a_ij,a_ji-a_ij)*(u_i-u_j);  
                                     fa[i]+=f_ij;  
                                     fa[j]-=f_ij;  
                                     break;  
                                 }  
                             }  
                         }  
                      }  
152                    }                    }
153                    /* anti diffusive flux from couple block */                 } else {
154                      if (d>0.) {
155                    /* TODO */                      Q_p+=a_ij*d;
156                      } else {
157                        Q_n+=a_ij*d;
158                      }
159                   }
160          }
161              #pragma ivdep
162          for (iptr_ij=(fc->flux_matrix->coupleBlock->pattern->ptr[i]);iptr_ij<(fc->flux_matrix->coupleBlock->pattern->ptr[i+1]); ++iptr_ij) {
163                   a_ij=fc->flux_matrix->coupleBlock->val[iptr_ij];
164                   j=fc->flux_matrix->coupleBlock->pattern->index[iptr_ij];
165                   d=u_remote[j]-u_i;
166                   if (a_ij<0.) {
167                       if (d<0.) {
168                         P_p+=a_ij*d;
169                       } else {
170                         P_n+=a_ij*d;
171                       }
172                   } else {
173                      if (d>0.) {
174                         Q_p+=a_ij*d;
175                      } else {
176                         Q_n+=a_ij*d;
177                      }
178                   }
179          }
180              /* set the smoothness indicators */
181              fc->r_p[i] = (P_p > 0.) ? FLUX_LIMITER(Q_p/P_p) : 0.;
182              fc->r_n[i] = (P_n < 0.) ? FLUX_LIMITER(Q_n/P_n) : 0.;
183    
184          } /* end of row loop for smootheness indicator */
185    
186          /*
187           * calculate antidiffusion
188          */
189          #pragma omp for schedule(static) private(i, u_i, sum, iptr_ij, a_ij, j, iptr_ji, a_ji,d_ij, u_j, r_ij, f_ij)
190          for (i = 0; i < n; ++i) {
191              u_i=u[i];
192              sum=0;
193              /* anti diffusive flux from main block */
194              for (iptr_ij=fc->flux_matrix->mainBlock->pattern->ptr[i];iptr_ij<fc->flux_matrix->mainBlock->pattern->ptr[i+1]; ++iptr_ij) {
195                  a_ij=fc->flux_matrix->mainBlock->val[iptr_ij];
196                  j=fc->flux_matrix->mainBlock->pattern->index[iptr_ij];
197                  if ( i!=j ) {
198                       /* find entry a[j,i] */
199                       for (iptr_ji=fc->flux_matrix->mainBlock->pattern->ptr[j];iptr_ji<fc->flux_matrix->mainBlock->pattern->ptr[j+1]; ++iptr_ji) {
200                          if (fc->flux_matrix->mainBlock->pattern->index[iptr_ji]==i) {
201                               a_ji=fc->flux_matrix->mainBlock->val[iptr_ji];
202                               d_ij=-MIN3(0,a_ji,a_ij);
203                               if (d_ij > 0.) {
204                                    u_j=u[j];
205                                    if (a_ji >= a_ij) {
206                                        r_ij = u_i>u_j ? fc->r_p[i] : fc->r_n[i];
207                                        f_ij =MIN(r_ij*d_ij,a_ji+d_ij);
208                                    } else {
209                                        r_ij = u_j>u_i ? fc->r_p[j] : fc->r_n[j];
210                                        f_ij =MIN(r_ij*d_ij,a_ij+d_ij);
211                                    }
212                                    sum+=f_ij*(u_i-u_j);
213                               }
214                               break;
215                          }
216                       }
217                }                }
218             }            }
219             #pragma omp barrier            /* anti diffusive flux from couple block */
220         }            /* TODO */
221    }  
222    
223    
224              fa[i]+=sum;
225          }
226      } /* end of parallel block */
227  }  }

Legend:
Removed from v.1361  
changed lines
  Added in v.1401

  ViewVC Help
Powered by ViewVC 1.1.26