/[escript]/trunk/paso/src/SolverFCT.c
ViewVC logotype

Diff of /trunk/paso/src/SolverFCT.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

trunk/paso/src/Solver_FluxControl.c revision 1361 by gross, Fri Dec 14 09:26:51 2007 UTC trunk/paso/src/SolverFCT.c revision 1362 by gross, Mon Dec 17 02:28:16 2007 UTC
# Line 13  Line 13 
13    
14  /**************************************************************/  /**************************************************************/
15    
16  /* Paso: FluxControl                                          */  /* Paso: FCTransportProblem                                          */
17    
18  /**************************************************************/  /**************************************************************/
19    
# Line 26  Line 26 
26  #include "SolverFCT.h"  #include "SolverFCT.h"
27  #include "PasoUtil.h"  #include "PasoUtil.h"
28    
 #define FLUX_S(a,b) ((SIGN(a)+SIGN(b))/2.)  
 #define MINMOD(a,b) (FLUX_S(a,b)*MIN(ABS(a),ABS(b)))  
 #define SUPERBEE(a,b) (FLUX_S(a,b)*MAX(MIN(2*ABS(a),ABS(b)),MIN(ABS(a),2*ABS(b))))  
   
 #define FLUX_L(a,b) SUPERBEE(a,b)  /* alter for other flux limiter */  
   
 #define FLUX_LIMITER(a) FLUX_L(a,1)  
29    
30  /**************************************************************/  /**************************************************************/
31    
32  /* free all memory used by FluxControl                                */  /* free all memory used by                                */
33    void Paso_FCTransportProblem_free(Paso_FCTransportProblem* in) {
34         if (in!=NULL) {
35            in->reference_counter--;
36            if (in->reference_counter<=0) {
37    
38  void Paso_Solver_FluxControl_free(Paso_Solver_FluxControl* in) {             Paso_SystemMatrix_free(in->transport_matrix);
39               Paso_SystemMatrix_free(in->flux_matrix);
40               Paso_MPIInfo_free(in->mpi_info);
41    
42               MEMFREE(in->lumped_mass_matrix);
43               MEMFREE(in->colorOf);
44               MEMFREE(in->main_iptr);
45               MEMFREE(in);
46            }
47        }
48    }
49    
50    Paso_FCTransportProblem* Paso_FCTransportProblem_getReference(Paso_FCTransportProblem* in) {
51       if (in!=NULL) {       if (in!=NULL) {
52          Paso_SystemMatrix_freeBuffer(in->matrix);          ++(in->reference_counter);
         Paso_SystemMatrix_free(in->matrix);  
         MEMFREE(in->colorOf);  
         MEMFREE(in->main_iptr);  
         MEMFREE(in);  
53       }       }
54    }    
55    
56    Paso_SystemMatrix* Paso_FCTransportProblem_borrowTransportMatrix(Paso_FCTransportProblem* in) {
57       return in->transport_matrix;
58  }  }
59    
60  /**************************************************************/  Paso_SystemMatrix* Paso_FCTransportProblem_borrowFluxMatrix(Paso_FCTransportProblem* in) {
61        return in->flux_matrix;
62    }
63    
64    double* Paso_FCTransportProblem_borrowLumpedMassMatrix(Paso_FCTransportProblem* in) {
65        return in->lumped_mass_matrix;
66    }
67    
68  /*   constructs a flux control mechanism                      */  dim_t Paso_FCTransportProblem_getTotalNumRows(Paso_FCTransportProblem* in) {
69        return Paso_SystemMatrix_getTotalNumRows(in->transport_matrix);
70    }
71    
72  Paso_Solver_FluxControl* Paso_SolverFCT_getFluxControl(Paso_SystemMatrix * A) {  Paso_FCTransportProblem* Paso_FCTransportProblem_alloc(double theta, Paso_SystemMatrixPattern *pattern, int block_size
73    
74    Paso_Solver_FluxControl* out=NULL;  
75    dim_t n,i;  ) {
76    index_t iptr,iptr_main,k;       Paso_SystemMatrixType matrix_type=MATRIX_FORMAT_DEFAULT+MATRIX_FORMAT_BLK1;  /* at the moment only block size 1 is supported */
77         Paso_FCTransportProblem* out=NULL;
78    if (A==NULL) return out;       dim_t n,i;
79    n=Paso_SystemMatrix_getTotalNumRows(A);       index_t iptr,iptr_main,k;
80    if (A->block_size!=1) {  
81          Paso_setError(TYPE_ERROR,"Paso_SolverFCT_getFluxControl: block size > 1 is not supported.");       if ((theta<0.) || (theta >1.)) {
82            Paso_setError(TYPE_ERROR,"Paso_FCTransportProblem_alloc: theta needs to be between 0. and. 1.");
83          return NULL;          return NULL;
84    }       }
85    out=MEMALLOC(1,Paso_Solver_FluxControl);  
86    if (Paso_checkPtr(out)) return NULL;       out=MEMALLOC(1,Paso_FCTransportProblem);
87         if (Paso_checkPtr(out)) return NULL;
88    
89    out->matrix=Paso_SystemMatrix_reference(A);       out->theta=theta;
90    out->colorOf=NULL;       out->transport_matrix=Paso_SystemMatrix_alloc(matrix_type,pattern,block_size,block_size);
91    out->main_iptr=NULL;       Paso_SystemMatrix_allocBuffer(out->transport_matrix);
92           out->flux_matrix=Paso_SystemMatrix_alloc(matrix_type,pattern,block_size,block_size);
93         out->mpi_info=Paso_MPIInfo_getReference(pattern->mpi_info);
94    /* allocations: */    
95    out->colorOf=MEMALLOC(n,index_t);       out->colorOf=NULL;
96    out->main_iptr=MEMALLOC(n,index_t);       out->main_iptr=NULL;
97    if ( ! (Paso_checkPtr(out->colorOf) || Paso_checkPtr(out->main_iptr) ) ) {       out->lumped_mass_matrix=NULL;
98        printf("Paso_SolverFCT_getFluxControl: Revise coloring!!\n");  
99        Paso_Pattern_color(A->mainBlock->pattern,&(out->num_colors),out->colorOf);       if (Paso_noError()) {
100        Paso_SystemMatrix_allocBuffer(A);           n=Paso_SystemMatrix_getTotalNumRows(out->transport_matrix);
101    
102        #pragma omp parallel for schedule(static) private(i,iptr,iptr_main,k)           out->colorOf=MEMALLOC(n,index_t);
103        for (i = 0; i < n; ++i) {           out->main_iptr=MEMALLOC(n,index_t);
104          for (iptr=A->mainBlock->pattern->ptr[i];iptr<A->mainBlock->pattern->ptr[i+1]; ++iptr) {           out->lumped_mass_matrix=MEMALLOC(n,double);
105               iptr_main=A->mainBlock->pattern->ptr[0]-1;  
106                for (iptr=A->mainBlock->pattern->ptr[i];iptr<A->mainBlock->pattern->ptr[i+1]; iptr++) {           if ( ! (Paso_checkPtr(out->colorOf) || Paso_checkPtr(out->main_iptr) || Paso_checkPtr(out->lumped_mass_matrix)) ) {
107                     if (A->mainBlock->pattern->index[iptr]==i) {              
108                          iptr_main=iptr;               printf("Paso_SolverFCT_getFCTransportProblem: Revise coloring!!\n");
109                          break;               Paso_Pattern_color(pattern->mainPattern,&(out->num_colors),out->colorOf);
110                     }  
111                 }              
112                 out->main_iptr[i]=iptr_main;               /* identify the main diagonals */
113                 if (iptr_main==A->mainBlock->pattern->ptr[0]-1)               #pragma omp parallel for schedule(static) private(i,iptr,iptr_main,k)
114                    Paso_setError(VALUE_ERROR, "Paso_SolverFCT_getFluxControl: no main diagonal");               for (i = 0; i < n; ++i) {
115             }                  for (iptr=pattern->mainPattern->ptr[i];iptr<pattern->mainPattern->ptr[i+1]; ++iptr) {
116         }                      iptr_main=pattern->mainPattern->ptr[0]-1;
117                        for (iptr=pattern->mainPattern->ptr[i];iptr<pattern->mainPattern->ptr[i+1]; iptr++) {
118                              if (pattern->mainPattern->index[iptr]==i) {
119                                   iptr_main=iptr;
120                                   break;
121                              }
122                        }
123                        out->main_iptr[i]=iptr_main;
124                        if (iptr_main==pattern->mainPattern->ptr[0]-1)
125                             Paso_setError(VALUE_ERROR, "Paso_FCTransportProblem_alloc: no main diagonal");
126                    }
127                 }
128    
129          }
130    
131    }    }
132    if (Paso_noError()) {    if (Paso_noError()) {
133       return out;       return out;
134    } else {    } else {
135       Paso_Solver_FluxControl_free(out);       Paso_FCTransportProblem_free(out);
136       return NULL;       return NULL;
137    }    }
138  }  }
   
 /**************************************************************/  
   
 /* adds A plus stabelising diffusion into the matrix B        */  
   
 /* d_ij=alpha*max(0,-a[i,j],-a[j,i])  */  
 /* b[i,j]+=alpha*(a[i,j]+d_ij)  */  
 /* b[j,i]+=alpha*(a[j,i]+d_ij)  */  
 /* b[i,i]-=alpha*d_ij  */  
 /* b[j,j]-=alpha*d_ij  */  
   
 void Paso_Solver_FluxControl_addDiffusion(Paso_Solver_FluxControl * fc, double alpha, Paso_SystemMatrix * B) {  
   dim_t n,i;  
   index_t color, iptr_ij,j,iptr_ji;  
   register double d_ij;  
   
   if (fc==NULL) return;  
   n=Paso_SystemMatrix_getTotalNumRows(fc->matrix);  
   /* TODO test - same pattern + block size */  
   
   #pragma omp parallel private(color)  
   {  
        /* process main block */  
        for (color=0;color<fc->num_colors;++color) {  
            #pragma omp for private(i,iptr_ij,j,iptr_ji,d_ij)  schedule(static)  
            for (i = 0; i < n; ++i) {  
                if (fc->colorOf[i]==color) {  
                   for (iptr_ij=fc->matrix->mainBlock->pattern->ptr[i];iptr_ij<fc->matrix->mainBlock->pattern->ptr[i+1]; ++iptr_ij) {  
                      j=fc->matrix->mainBlock->pattern->index[iptr_ij];  
                      if (i<j) {  
                         /* find entry a[j,i] */  
                         for (iptr_ji=fc->matrix->mainBlock->pattern->ptr[i];iptr_ji<fc->matrix->mainBlock->pattern->ptr[j+1]-1; ++iptr_ji) {  
                             if (fc->matrix->mainBlock->pattern->index[iptr_ji]==i) {  
                                 d_ij=(-alpha)*MIN3(0.,fc->matrix->mainBlock->val[iptr_ij],fc->matrix->mainBlock->val[iptr_ji]);  
                                 B->mainBlock->val[iptr_ij]+=alpha*fc->matrix->mainBlock->val[iptr_ij]+d_ij;  
                                 B->mainBlock->val[iptr_ji]+=alpha*fc->matrix->mainBlock->val[iptr_ji]+d_ij;  
                                 B->mainBlock->val[fc->main_iptr[i]]-=d_ij;  
                                 B->mainBlock->val[fc->main_iptr[j]]-=d_ij;  
                                 break;  
                             }  
                         }  
                      }  
                           
                   }  
                   /* TODO process couple block */  
                }  
            }  
            #pragma omp barrier  
        }  
   }  
   
 }  
 /**************************************************************/  
   
 /* adds antidiffusion to fa    
   
    P_p[i] + = sum_j min(0,a[i,j]) min(0,u[j]-u[i])    
    P_n[i] + = sum_j min(0,a[i,j]) max(0,u[j]-u[i])    
    Q_p[i] + = sum_j max(0,a[i,j]) max(0,u[j]-u[i])    
    Q_n[i] + = sum_j max(0,a[i,j]) min(0,u[j]-u[i])    
    d_ij=max(0,-a[i,j],-a[j,i])  
    l_ji=max(0,a[j,i],a[j,i]-a[i,j])  
    if a[j,i] >= a[i,j] and 0>a[i,j] : (i.e d_ij>0 and l_ji>=l_ij)  
       r_ij = u[i]>u[j] ? Q_p[i]/P_p[i] : Q_n[i]/Q_n[i]  
       f_ij =min(FLUX_LIMITER(r_ij)*d_ij,l_ji) (u[i]-u[j])=min(FLUX_LIMITER(r_ij)*a[i,j],a[j,i]-a[i,j]) (u[i]-u[j])  
       fa[i]+=f_ij  
       fa[j]-=f_ij  
   
 */  
   
 void Paso_Solver_FluxControl_setAntiDiffusiveFlux(Paso_Solver_FluxControl * fc, double * u, double* fa) {  
   
   register double u_i,P_p,P_n,Q_p,Q_n,r_p,r_n, a_ij, d, u_j, r_ij, f_ij, a_ji;  
   double *u_remote=NULL;  
   index_t color, iptr_ij,j,iptr_ji, i;  
   dim_t n;  
   
   
   if (fc==NULL) return;  
   n=Paso_SystemMatrix_getTotalNumRows(fc->matrix);  
   /* exchange */  
   Paso_SystemMatrix_startCollect(fc->matrix,u);  
   u_remote=Paso_SystemMatrix_finishCollect(fc->matrix);  
   
   #pragma omp parallel private(color)  
   {  
        for (color=0;color<fc->num_colors;++color) {  
            #pragma omp for schedule(static) private(i, u_i,P_p,P_n,Q_p,Q_n,r_p,r_n,iptr_ij,a_ij,d,j,iptr_ji, u_j, r_ij, f_ij, a_ji)  
            for (i = 0; i < n; ++i) {  
               if (fc->colorOf[i]==color) {  
                   u_i=u[i];  
                   /* gather the smoothness sensor */  
                   P_p=0.;  
                   P_n=0.;  
                   Q_p=0.;  
                   Q_n=0.;  
                   #pragma ivdep  
               for (iptr_ij=(fc->matrix->mainBlock->pattern->ptr[i]);iptr_ij<(fc->matrix->mainBlock->pattern->ptr[i+1]); ++iptr_ij) {  
                       a_ij=fc->matrix->mainBlock->val[iptr_ij];  
                       j=fc->matrix->mainBlock->pattern->index[iptr_ij];  
                       d=u[j]-u_i;  
                       if (a_ij<0.) {  
                          if (d<0.) {  
                             P_p+=a_ij*d;  
                          } else {  
                             P_n+=a_ij*d;  
                          }  
                       } else {  
                          if (d>0.) {  
                             Q_p+=a_ij*d;  
                          } else {  
                             Q_n+=a_ij*d;  
                          }  
                       }  
               }  
                   #pragma ivdep  
               for (iptr_ij=(fc->matrix->coupleBlock->pattern->ptr[i]);iptr_ij<(fc->matrix->coupleBlock->pattern->ptr[i+1]); ++iptr_ij) {  
                       a_ij=fc->matrix->coupleBlock->val[iptr_ij];  
                       j=fc->matrix->coupleBlock->pattern->index[iptr_ij];  
                       d=u_remote[j]-u_i;  
                       if (a_ij<0.) {  
                          if (d<0.) {  
                             P_p+=a_ij*d;  
                          } else {  
                             P_n+=a_ij*d;  
                          }  
                       } else {  
                          if (d>0.) {  
                             Q_p+=a_ij*d;  
                          } else {  
                             Q_n+=a_ij*d;  
                          }  
                       }  
               }  
                   /* set the smoothness indicators */  
                   r_p = (P_p > 0.) ? FLUX_LIMITER(Q_p/P_p) : 0.;  
                   r_n = (P_n < 0 ) ? FLUX_LIMITER(Q_n/P_n) : 0.;  
                   /* anti diffusive flux from main block */  
                   for (iptr_ij=fc->matrix->mainBlock->pattern->ptr[i];iptr_ij<fc->matrix->mainBlock->pattern->ptr[i+1]; ++iptr_ij) {  
                      a_ij=fc->matrix->mainBlock->val[iptr_ij];  
                      j=fc->matrix->mainBlock->pattern->index[iptr_ij];  
                      if (a_ij < 0 && i!=j) {  
                         /* find entry a[j,i] */  
                         for (iptr_ji=fc->matrix->mainBlock->pattern->ptr[i];iptr_ji<fc->matrix->mainBlock->pattern->ptr[j+1]-1; ++iptr_ji) {  
                             if (fc->matrix->mainBlock->pattern->index[iptr_ji]==i) {  
                                 a_ji=fc->matrix->mainBlock->val[iptr_ji];  
                                 if  (a_ji > a_ij || (a_ji == a_ij && j<i) ) {  
                                     u_j=u[j];  
                                     r_ij = u_i>u_j ? r_p : r_n;  
                                     f_ij =MIN(r_ij*a_ij,a_ji-a_ij)*(u_i-u_j);  
                                     fa[i]+=f_ij;  
                                     fa[j]-=f_ij;  
                                     break;  
                                 }  
                             }  
                         }  
                      }  
                   }  
                   /* anti diffusive flux from couple block */  
   
                   /* TODO */  
               }  
            }  
            #pragma omp barrier  
        }  
   }  
 }  

Legend:
Removed from v.1361  
changed lines
  Added in v.1362

  ViewVC Help
Powered by ViewVC 1.1.26