/[escript]/trunk/paso/src/SolverFCT.c
ViewVC logotype

Diff of /trunk/paso/src/SolverFCT.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

trunk/paso/src/Solver_FluxControl.c revision 1361 by gross, Fri Dec 14 09:26:51 2007 UTC trunk/paso/src/SolverFCT.c revision 1364 by gross, Mon Dec 17 07:22:45 2007 UTC
# Line 13  Line 13 
13    
14  /**************************************************************/  /**************************************************************/
15    
16  /* Paso: FluxControl                                          */  /* Paso: FCTransportProblem                                          */
17    
18  /**************************************************************/  /**************************************************************/
19    
# Line 26  Line 26 
26  #include "SolverFCT.h"  #include "SolverFCT.h"
27  #include "PasoUtil.h"  #include "PasoUtil.h"
28    
 #define FLUX_S(a,b) ((SIGN(a)+SIGN(b))/2.)  
 #define MINMOD(a,b) (FLUX_S(a,b)*MIN(ABS(a),ABS(b)))  
 #define SUPERBEE(a,b) (FLUX_S(a,b)*MAX(MIN(2*ABS(a),ABS(b)),MIN(ABS(a),2*ABS(b))))  
   
 #define FLUX_L(a,b) SUPERBEE(a,b)  /* alter for other flux limiter */  
   
 #define FLUX_LIMITER(a) FLUX_L(a,1)  
29    
30  /**************************************************************/  /**************************************************************/
31    
32  /* free all memory used by FluxControl                                */  /* free all memory used by                                */
33    void Paso_FCTransportProblem_free(Paso_FCTransportProblem* in) {
34         if (in!=NULL) {
35            in->reference_counter--;
36            if (in->reference_counter<=0) {
37    
38  void Paso_Solver_FluxControl_free(Paso_Solver_FluxControl* in) {             Paso_SystemMatrix_free(in->transport_matrix);
39               Paso_SystemMatrix_free(in->flux_matrix);
40               Paso_MPIInfo_free(in->mpi_info);
41    
42               MEMFREE(in->u);
43               MEMFREE(in->lumped_mass_matrix);
44               MEMFREE(in->row_sum_flux_matrix);
45               MEMFREE(in->colorOf);
46               MEMFREE(in->main_iptr);
47               MEMFREE(in);
48            }
49        }
50    }
51    
52    Paso_FCTransportProblem* Paso_FCTransportProblem_getReference(Paso_FCTransportProblem* in) {
53       if (in!=NULL) {       if (in!=NULL) {
54          Paso_SystemMatrix_freeBuffer(in->matrix);          ++(in->reference_counter);
         Paso_SystemMatrix_free(in->matrix);  
         MEMFREE(in->colorOf);  
         MEMFREE(in->main_iptr);  
         MEMFREE(in);  
55       }       }
56    }    
57    
58    Paso_SystemMatrix* Paso_FCTransportProblem_borrowTransportMatrix(Paso_FCTransportProblem* in) {
59       return in->transport_matrix;
60  }  }
61    
62  /**************************************************************/  Paso_SystemMatrix* Paso_FCTransportProblem_borrowFluxMatrix(Paso_FCTransportProblem* in) {
63        return in->flux_matrix;
64    }
65    
66    double* Paso_FCTransportProblem_borrowLumpedMassMatrix(Paso_FCTransportProblem* in) {
67        return in->lumped_mass_matrix;
68    }
69    
70    dim_t Paso_FCTransportProblem_getTotalNumRows(Paso_FCTransportProblem* in) {
71        return Paso_SystemMatrix_getTotalNumRows(in->transport_matrix);
72    }
73    
74    Paso_FCTransportProblem* Paso_FCTransportProblem_alloc(double theta, Paso_SystemMatrixPattern *pattern, int block_size
75    
 /*   constructs a flux control mechanism                      */  
76    
77  Paso_Solver_FluxControl* Paso_SolverFCT_getFluxControl(Paso_SystemMatrix * A) {  ) {
78         Paso_SystemMatrixType matrix_type=MATRIX_FORMAT_DEFAULT+MATRIX_FORMAT_BLK1;  /* at the moment only block size 1 is supported */
79         Paso_FCTransportProblem* out=NULL;
80         dim_t n,i;
81         index_t iptr,iptr_main,k;
82    
83    Paso_Solver_FluxControl* out=NULL;       if ((theta<0.) || (theta >1.)) {
84    dim_t n,i;          Paso_setError(TYPE_ERROR,"Paso_FCTransportProblem_alloc: theta needs to be between 0. and. 1.");
   index_t iptr,iptr_main,k;  
   
   if (A==NULL) return out;  
   n=Paso_SystemMatrix_getTotalNumRows(A);  
   if (A->block_size!=1) {  
         Paso_setError(TYPE_ERROR,"Paso_SolverFCT_getFluxControl: block size > 1 is not supported.");  
85          return NULL;          return NULL;
86    }       }
87    out=MEMALLOC(1,Paso_Solver_FluxControl);  
88    if (Paso_checkPtr(out)) return NULL;       out=MEMALLOC(1,Paso_FCTransportProblem);
89         if (Paso_checkPtr(out)) return NULL;
90    
91         out->theta=theta;
92         out->valid_matrices=FALSE;
93         out->transport_matrix=Paso_SystemMatrix_alloc(matrix_type,pattern,block_size,block_size);
94         Paso_SystemMatrix_allocBuffer(out->transport_matrix);
95         out->flux_matrix=Paso_SystemMatrix_alloc(matrix_type,pattern,block_size,block_size);
96         out->mpi_info=Paso_MPIInfo_getReference(pattern->mpi_info);
97    
98         out->colorOf=NULL;
99         out->main_iptr=NULL;
100         out->lumped_mass_matrix=NULL;
101         out->row_sum_flux_matrix=NULL;
102    
103         if (Paso_noError()) {
104             n=Paso_SystemMatrix_getTotalNumRows(out->transport_matrix);
105    
106             out->colorOf=MEMALLOC(n,index_t);
107             out->main_iptr=MEMALLOC(n,index_t);
108             out->lumped_mass_matrix=MEMALLOC(n,double);
109             out->row_sum_flux_matrix=MEMALLOC(n,double);
110             out->u=MEMALLOC(n,double);
111    
112             if ( ! (Paso_checkPtr(out->colorOf) || Paso_checkPtr(out->main_iptr) ||
113                     Paso_checkPtr(out->lumped_mass_matrix) || Paso_checkPtr(out->row_sum_flux_matrix) || Paso_checkPtr(out->u)) ) {
114                
115                 printf("Paso_SolverFCT_getFCTransportProblem: Revise coloring!!\n");
116                 Paso_Pattern_color(pattern->mainPattern,&(out->num_colors),out->colorOf);
117    
118                
119                 /* identify the main diagonals */
120                 #pragma omp parallel for schedule(static) private(i,iptr,iptr_main,k)
121                 for (i = 0; i < n; ++i) {
122                    for (iptr=pattern->mainPattern->ptr[i];iptr<pattern->mainPattern->ptr[i+1]; ++iptr) {
123                        iptr_main=pattern->mainPattern->ptr[0]-1;
124                        for (iptr=pattern->mainPattern->ptr[i];iptr<pattern->mainPattern->ptr[i+1]; iptr++) {
125                              if (pattern->mainPattern->index[iptr]==i) {
126                                   iptr_main=iptr;
127                                   break;
128                              }
129                        }
130                        out->main_iptr[i]=iptr_main;
131                        if (iptr_main==pattern->mainPattern->ptr[0]-1)
132                             Paso_setError(VALUE_ERROR, "Paso_FCTransportProblem_alloc: no main diagonal");
133                    }
134                 }
135    
136    out->matrix=Paso_SystemMatrix_reference(A);        }
   out->colorOf=NULL;  
   out->main_iptr=NULL;  
     
   
   /* allocations: */    
   out->colorOf=MEMALLOC(n,index_t);  
   out->main_iptr=MEMALLOC(n,index_t);  
   if ( ! (Paso_checkPtr(out->colorOf) || Paso_checkPtr(out->main_iptr) ) ) {  
       printf("Paso_SolverFCT_getFluxControl: Revise coloring!!\n");  
       Paso_Pattern_color(A->mainBlock->pattern,&(out->num_colors),out->colorOf);  
       Paso_SystemMatrix_allocBuffer(A);  
   
       #pragma omp parallel for schedule(static) private(i,iptr,iptr_main,k)  
       for (i = 0; i < n; ++i) {  
         for (iptr=A->mainBlock->pattern->ptr[i];iptr<A->mainBlock->pattern->ptr[i+1]; ++iptr) {  
              iptr_main=A->mainBlock->pattern->ptr[0]-1;  
               for (iptr=A->mainBlock->pattern->ptr[i];iptr<A->mainBlock->pattern->ptr[i+1]; iptr++) {  
                    if (A->mainBlock->pattern->index[iptr]==i) {  
                         iptr_main=iptr;  
                         break;  
                    }  
                }  
                out->main_iptr[i]=iptr_main;  
                if (iptr_main==A->mainBlock->pattern->ptr[0]-1)  
                   Paso_setError(VALUE_ERROR, "Paso_SolverFCT_getFluxControl: no main diagonal");  
            }  
        }  
137    
138    }    }
139    if (Paso_noError()) {    if (Paso_noError()) {
140       return out;       return out;
141    } else {    } else {
142       Paso_Solver_FluxControl_free(out);       Paso_FCTransportProblem_free(out);
143       return NULL;       return NULL;
144    }    }
145  }  }
146    
147  /**************************************************************/  void Paso_FCTransportProblem_checkinSolution(Paso_FCTransportProblem* in, double* u) {
148        dim_t i, n;
149  /* adds A plus stabelising diffusion into the matrix B        */    
150        n=Paso_FCTransportProblem_getTotalNumRows(in);
151  /* d_ij=alpha*max(0,-a[i,j],-a[j,i])  */      #pragma omp parallel for schedule(static) private(i)
152  /* b[i,j]+=alpha*(a[i,j]+d_ij)  */      for (i = 0; i < n; ++i) {
153  /* b[j,i]+=alpha*(a[j,i]+d_ij)  */           in->u[i]=u[i];
154  /* b[i,i]-=alpha*d_ij  */      }
 /* b[j,j]-=alpha*d_ij  */  
   
 void Paso_Solver_FluxControl_addDiffusion(Paso_Solver_FluxControl * fc, double alpha, Paso_SystemMatrix * B) {  
   dim_t n,i;  
   index_t color, iptr_ij,j,iptr_ji;  
   register double d_ij;  
   
   if (fc==NULL) return;  
   n=Paso_SystemMatrix_getTotalNumRows(fc->matrix);  
   /* TODO test - same pattern + block size */  
   
   #pragma omp parallel private(color)  
   {  
        /* process main block */  
        for (color=0;color<fc->num_colors;++color) {  
            #pragma omp for private(i,iptr_ij,j,iptr_ji,d_ij)  schedule(static)  
            for (i = 0; i < n; ++i) {  
                if (fc->colorOf[i]==color) {  
                   for (iptr_ij=fc->matrix->mainBlock->pattern->ptr[i];iptr_ij<fc->matrix->mainBlock->pattern->ptr[i+1]; ++iptr_ij) {  
                      j=fc->matrix->mainBlock->pattern->index[iptr_ij];  
                      if (i<j) {  
                         /* find entry a[j,i] */  
                         for (iptr_ji=fc->matrix->mainBlock->pattern->ptr[i];iptr_ji<fc->matrix->mainBlock->pattern->ptr[j+1]-1; ++iptr_ji) {  
                             if (fc->matrix->mainBlock->pattern->index[iptr_ji]==i) {  
                                 d_ij=(-alpha)*MIN3(0.,fc->matrix->mainBlock->val[iptr_ij],fc->matrix->mainBlock->val[iptr_ji]);  
                                 B->mainBlock->val[iptr_ij]+=alpha*fc->matrix->mainBlock->val[iptr_ij]+d_ij;  
                                 B->mainBlock->val[iptr_ji]+=alpha*fc->matrix->mainBlock->val[iptr_ji]+d_ij;  
                                 B->mainBlock->val[fc->main_iptr[i]]-=d_ij;  
                                 B->mainBlock->val[fc->main_iptr[j]]-=d_ij;  
                                 break;  
                             }  
                         }  
                      }  
                           
                   }  
                   /* TODO process couple block */  
                }  
            }  
            #pragma omp barrier  
        }  
   }  
   
 }  
 /**************************************************************/  
   
 /* adds antidiffusion to fa    
   
    P_p[i] + = sum_j min(0,a[i,j]) min(0,u[j]-u[i])    
    P_n[i] + = sum_j min(0,a[i,j]) max(0,u[j]-u[i])    
    Q_p[i] + = sum_j max(0,a[i,j]) max(0,u[j]-u[i])    
    Q_n[i] + = sum_j max(0,a[i,j]) min(0,u[j]-u[i])    
    d_ij=max(0,-a[i,j],-a[j,i])  
    l_ji=max(0,a[j,i],a[j,i]-a[i,j])  
    if a[j,i] >= a[i,j] and 0>a[i,j] : (i.e d_ij>0 and l_ji>=l_ij)  
       r_ij = u[i]>u[j] ? Q_p[i]/P_p[i] : Q_n[i]/Q_n[i]  
       f_ij =min(FLUX_LIMITER(r_ij)*d_ij,l_ji) (u[i]-u[j])=min(FLUX_LIMITER(r_ij)*a[i,j],a[j,i]-a[i,j]) (u[i]-u[j])  
       fa[i]+=f_ij  
       fa[j]-=f_ij  
   
 */  
   
 void Paso_Solver_FluxControl_setAntiDiffusiveFlux(Paso_Solver_FluxControl * fc, double * u, double* fa) {  
   
   register double u_i,P_p,P_n,Q_p,Q_n,r_p,r_n, a_ij, d, u_j, r_ij, f_ij, a_ji;  
   double *u_remote=NULL;  
   index_t color, iptr_ij,j,iptr_ji, i;  
   dim_t n;  
   
   
   if (fc==NULL) return;  
   n=Paso_SystemMatrix_getTotalNumRows(fc->matrix);  
   /* exchange */  
   Paso_SystemMatrix_startCollect(fc->matrix,u);  
   u_remote=Paso_SystemMatrix_finishCollect(fc->matrix);  
   
   #pragma omp parallel private(color)  
   {  
        for (color=0;color<fc->num_colors;++color) {  
            #pragma omp for schedule(static) private(i, u_i,P_p,P_n,Q_p,Q_n,r_p,r_n,iptr_ij,a_ij,d,j,iptr_ji, u_j, r_ij, f_ij, a_ji)  
            for (i = 0; i < n; ++i) {  
               if (fc->colorOf[i]==color) {  
                   u_i=u[i];  
                   /* gather the smoothness sensor */  
                   P_p=0.;  
                   P_n=0.;  
                   Q_p=0.;  
                   Q_n=0.;  
                   #pragma ivdep  
               for (iptr_ij=(fc->matrix->mainBlock->pattern->ptr[i]);iptr_ij<(fc->matrix->mainBlock->pattern->ptr[i+1]); ++iptr_ij) {  
                       a_ij=fc->matrix->mainBlock->val[iptr_ij];  
                       j=fc->matrix->mainBlock->pattern->index[iptr_ij];  
                       d=u[j]-u_i;  
                       if (a_ij<0.) {  
                          if (d<0.) {  
                             P_p+=a_ij*d;  
                          } else {  
                             P_n+=a_ij*d;  
                          }  
                       } else {  
                          if (d>0.) {  
                             Q_p+=a_ij*d;  
                          } else {  
                             Q_n+=a_ij*d;  
                          }  
                       }  
               }  
                   #pragma ivdep  
               for (iptr_ij=(fc->matrix->coupleBlock->pattern->ptr[i]);iptr_ij<(fc->matrix->coupleBlock->pattern->ptr[i+1]); ++iptr_ij) {  
                       a_ij=fc->matrix->coupleBlock->val[iptr_ij];  
                       j=fc->matrix->coupleBlock->pattern->index[iptr_ij];  
                       d=u_remote[j]-u_i;  
                       if (a_ij<0.) {  
                          if (d<0.) {  
                             P_p+=a_ij*d;  
                          } else {  
                             P_n+=a_ij*d;  
                          }  
                       } else {  
                          if (d>0.) {  
                             Q_p+=a_ij*d;  
                          } else {  
                             Q_n+=a_ij*d;  
                          }  
                       }  
               }  
                   /* set the smoothness indicators */  
                   r_p = (P_p > 0.) ? FLUX_LIMITER(Q_p/P_p) : 0.;  
                   r_n = (P_n < 0 ) ? FLUX_LIMITER(Q_n/P_n) : 0.;  
                   /* anti diffusive flux from main block */  
                   for (iptr_ij=fc->matrix->mainBlock->pattern->ptr[i];iptr_ij<fc->matrix->mainBlock->pattern->ptr[i+1]; ++iptr_ij) {  
                      a_ij=fc->matrix->mainBlock->val[iptr_ij];  
                      j=fc->matrix->mainBlock->pattern->index[iptr_ij];  
                      if (a_ij < 0 && i!=j) {  
                         /* find entry a[j,i] */  
                         for (iptr_ji=fc->matrix->mainBlock->pattern->ptr[i];iptr_ji<fc->matrix->mainBlock->pattern->ptr[j+1]-1; ++iptr_ji) {  
                             if (fc->matrix->mainBlock->pattern->index[iptr_ji]==i) {  
                                 a_ji=fc->matrix->mainBlock->val[iptr_ji];  
                                 if  (a_ji > a_ij || (a_ji == a_ij && j<i) ) {  
                                     u_j=u[j];  
                                     r_ij = u_i>u_j ? r_p : r_n;  
                                     f_ij =MIN(r_ij*a_ij,a_ji-a_ij)*(u_i-u_j);  
                                     fa[i]+=f_ij;  
                                     fa[j]-=f_ij;  
                                     break;  
                                 }  
                             }  
                         }  
                      }  
                   }  
                   /* anti diffusive flux from couple block */  
   
                   /* TODO */  
               }  
            }  
            #pragma omp barrier  
        }  
   }  
155  }  }

Legend:
Removed from v.1361  
changed lines
  Added in v.1364

  ViewVC Help
Powered by ViewVC 1.1.26