/[escript]/trunk/paso/src/SolverFCT.c
ViewVC logotype

Diff of /trunk/paso/src/SolverFCT.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

trunk/paso/src/Solver_FluxControl.c revision 1361 by gross, Fri Dec 14 09:26:51 2007 UTC trunk/paso/src/SolverFCT.c revision 1363 by gross, Mon Dec 17 03:42:03 2007 UTC
# Line 13  Line 13 
13    
14  /**************************************************************/  /**************************************************************/
15    
16  /* Paso: FluxControl                                          */  /* Paso: FCTransportProblem                                          */
17    
18  /**************************************************************/  /**************************************************************/
19    
# Line 26  Line 26 
26  #include "SolverFCT.h"  #include "SolverFCT.h"
27  #include "PasoUtil.h"  #include "PasoUtil.h"
28    
 #define FLUX_S(a,b) ((SIGN(a)+SIGN(b))/2.)  
 #define MINMOD(a,b) (FLUX_S(a,b)*MIN(ABS(a),ABS(b)))  
 #define SUPERBEE(a,b) (FLUX_S(a,b)*MAX(MIN(2*ABS(a),ABS(b)),MIN(ABS(a),2*ABS(b))))  
   
 #define FLUX_L(a,b) SUPERBEE(a,b)  /* alter for other flux limiter */  
   
 #define FLUX_LIMITER(a) FLUX_L(a,1)  
29    
30  /**************************************************************/  /**************************************************************/
31    
32  /* free all memory used by FluxControl                                */  /* free all memory used by                                */
33    void Paso_FCTransportProblem_free(Paso_FCTransportProblem* in) {
34         if (in!=NULL) {
35            in->reference_counter--;
36            if (in->reference_counter<=0) {
37    
38  void Paso_Solver_FluxControl_free(Paso_Solver_FluxControl* in) {             Paso_SystemMatrix_free(in->transport_matrix);
39               Paso_SystemMatrix_free(in->flux_matrix);
40               Paso_MPIInfo_free(in->mpi_info);
41    
42               MEMFREE(in->lumped_mass_matrix);
43               MEMFREE(in->row_sum_flux_matrix);
44               MEMFREE(in->colorOf);
45               MEMFREE(in->main_iptr);
46               MEMFREE(in);
47            }
48        }
49    }
50    
51    Paso_FCTransportProblem* Paso_FCTransportProblem_getReference(Paso_FCTransportProblem* in) {
52       if (in!=NULL) {       if (in!=NULL) {
53          Paso_SystemMatrix_freeBuffer(in->matrix);          ++(in->reference_counter);
         Paso_SystemMatrix_free(in->matrix);  
         MEMFREE(in->colorOf);  
         MEMFREE(in->main_iptr);  
         MEMFREE(in);  
54       }       }
55    }    
56    
57    Paso_SystemMatrix* Paso_FCTransportProblem_borrowTransportMatrix(Paso_FCTransportProblem* in) {
58       return in->transport_matrix;
59  }  }
60    
61  /**************************************************************/  Paso_SystemMatrix* Paso_FCTransportProblem_borrowFluxMatrix(Paso_FCTransportProblem* in) {
62        return in->flux_matrix;
63    }
64    
65    double* Paso_FCTransportProblem_borrowLumpedMassMatrix(Paso_FCTransportProblem* in) {
66        return in->lumped_mass_matrix;
67    }
68    
69  /*   constructs a flux control mechanism                      */  dim_t Paso_FCTransportProblem_getTotalNumRows(Paso_FCTransportProblem* in) {
70        return Paso_SystemMatrix_getTotalNumRows(in->transport_matrix);
71    }
72    
73  Paso_Solver_FluxControl* Paso_SolverFCT_getFluxControl(Paso_SystemMatrix * A) {  Paso_FCTransportProblem* Paso_FCTransportProblem_alloc(double theta, Paso_SystemMatrixPattern *pattern, int block_size
74    
75    Paso_Solver_FluxControl* out=NULL;  
76    dim_t n,i;  ) {
77    index_t iptr,iptr_main,k;       Paso_SystemMatrixType matrix_type=MATRIX_FORMAT_DEFAULT+MATRIX_FORMAT_BLK1;  /* at the moment only block size 1 is supported */
78         Paso_FCTransportProblem* out=NULL;
79    if (A==NULL) return out;       dim_t n,i;
80    n=Paso_SystemMatrix_getTotalNumRows(A);       index_t iptr,iptr_main,k;
81    if (A->block_size!=1) {  
82          Paso_setError(TYPE_ERROR,"Paso_SolverFCT_getFluxControl: block size > 1 is not supported.");       if ((theta<0.) || (theta >1.)) {
83            Paso_setError(TYPE_ERROR,"Paso_FCTransportProblem_alloc: theta needs to be between 0. and. 1.");
84          return NULL;          return NULL;
85    }       }
86    out=MEMALLOC(1,Paso_Solver_FluxControl);  
87    if (Paso_checkPtr(out)) return NULL;       out=MEMALLOC(1,Paso_FCTransportProblem);
88         if (Paso_checkPtr(out)) return NULL;
89    
90    out->matrix=Paso_SystemMatrix_reference(A);       out->theta=theta;
91    out->colorOf=NULL;       out->valid_matrices=FALSE;
92    out->main_iptr=NULL;       out->transport_matrix=Paso_SystemMatrix_alloc(matrix_type,pattern,block_size,block_size);
93           Paso_SystemMatrix_allocBuffer(out->transport_matrix);
94         out->flux_matrix=Paso_SystemMatrix_alloc(matrix_type,pattern,block_size,block_size);
95    /* allocations: */         out->mpi_info=Paso_MPIInfo_getReference(pattern->mpi_info);
96    out->colorOf=MEMALLOC(n,index_t);  
97    out->main_iptr=MEMALLOC(n,index_t);       out->colorOf=NULL;
98    if ( ! (Paso_checkPtr(out->colorOf) || Paso_checkPtr(out->main_iptr) ) ) {       out->main_iptr=NULL;
99        printf("Paso_SolverFCT_getFluxControl: Revise coloring!!\n");       out->lumped_mass_matrix=NULL;
100        Paso_Pattern_color(A->mainBlock->pattern,&(out->num_colors),out->colorOf);       out->row_sum_flux_matrix=NULL;
101        Paso_SystemMatrix_allocBuffer(A);  
102         if (Paso_noError()) {
103        #pragma omp parallel for schedule(static) private(i,iptr,iptr_main,k)           n=Paso_SystemMatrix_getTotalNumRows(out->transport_matrix);
104        for (i = 0; i < n; ++i) {  
105          for (iptr=A->mainBlock->pattern->ptr[i];iptr<A->mainBlock->pattern->ptr[i+1]; ++iptr) {           out->colorOf=MEMALLOC(n,index_t);
106               iptr_main=A->mainBlock->pattern->ptr[0]-1;           out->main_iptr=MEMALLOC(n,index_t);
107                for (iptr=A->mainBlock->pattern->ptr[i];iptr<A->mainBlock->pattern->ptr[i+1]; iptr++) {           out->lumped_mass_matrix=MEMALLOC(n,double);
108                     if (A->mainBlock->pattern->index[iptr]==i) {           out->row_sum_flux_matrix=MEMALLOC(n,double);
109                          iptr_main=iptr;  
110                          break;           if ( ! (Paso_checkPtr(out->colorOf) || Paso_checkPtr(out->main_iptr) ||
111                     }                   Paso_checkPtr(out->lumped_mass_matrix) || Paso_checkPtr(out->row_sum_flux_matrix)) ) {
112                 }              
113                 out->main_iptr[i]=iptr_main;               printf("Paso_SolverFCT_getFCTransportProblem: Revise coloring!!\n");
114                 if (iptr_main==A->mainBlock->pattern->ptr[0]-1)               Paso_Pattern_color(pattern->mainPattern,&(out->num_colors),out->colorOf);
115                    Paso_setError(VALUE_ERROR, "Paso_SolverFCT_getFluxControl: no main diagonal");  
116             }              
117         }               /* identify the main diagonals */
118                 #pragma omp parallel for schedule(static) private(i,iptr,iptr_main,k)
119                 for (i = 0; i < n; ++i) {
120                    for (iptr=pattern->mainPattern->ptr[i];iptr<pattern->mainPattern->ptr[i+1]; ++iptr) {
121                        iptr_main=pattern->mainPattern->ptr[0]-1;
122                        for (iptr=pattern->mainPattern->ptr[i];iptr<pattern->mainPattern->ptr[i+1]; iptr++) {
123                              if (pattern->mainPattern->index[iptr]==i) {
124                                   iptr_main=iptr;
125                                   break;
126                              }
127                        }
128                        out->main_iptr[i]=iptr_main;
129                        if (iptr_main==pattern->mainPattern->ptr[0]-1)
130                             Paso_setError(VALUE_ERROR, "Paso_FCTransportProblem_alloc: no main diagonal");
131                    }
132                 }
133    
134          }
135    
136    }    }
137    if (Paso_noError()) {    if (Paso_noError()) {
138       return out;       return out;
139    } else {    } else {
140       Paso_Solver_FluxControl_free(out);       Paso_FCTransportProblem_free(out);
141       return NULL;       return NULL;
142    }    }
143  }  }
   
 /**************************************************************/  
   
 /* adds A plus stabelising diffusion into the matrix B        */  
   
 /* d_ij=alpha*max(0,-a[i,j],-a[j,i])  */  
 /* b[i,j]+=alpha*(a[i,j]+d_ij)  */  
 /* b[j,i]+=alpha*(a[j,i]+d_ij)  */  
 /* b[i,i]-=alpha*d_ij  */  
 /* b[j,j]-=alpha*d_ij  */  
   
 void Paso_Solver_FluxControl_addDiffusion(Paso_Solver_FluxControl * fc, double alpha, Paso_SystemMatrix * B) {  
   dim_t n,i;  
   index_t color, iptr_ij,j,iptr_ji;  
   register double d_ij;  
   
   if (fc==NULL) return;  
   n=Paso_SystemMatrix_getTotalNumRows(fc->matrix);  
   /* TODO test - same pattern + block size */  
   
   #pragma omp parallel private(color)  
   {  
        /* process main block */  
        for (color=0;color<fc->num_colors;++color) {  
            #pragma omp for private(i,iptr_ij,j,iptr_ji,d_ij)  schedule(static)  
            for (i = 0; i < n; ++i) {  
                if (fc->colorOf[i]==color) {  
                   for (iptr_ij=fc->matrix->mainBlock->pattern->ptr[i];iptr_ij<fc->matrix->mainBlock->pattern->ptr[i+1]; ++iptr_ij) {  
                      j=fc->matrix->mainBlock->pattern->index[iptr_ij];  
                      if (i<j) {  
                         /* find entry a[j,i] */  
                         for (iptr_ji=fc->matrix->mainBlock->pattern->ptr[i];iptr_ji<fc->matrix->mainBlock->pattern->ptr[j+1]-1; ++iptr_ji) {  
                             if (fc->matrix->mainBlock->pattern->index[iptr_ji]==i) {  
                                 d_ij=(-alpha)*MIN3(0.,fc->matrix->mainBlock->val[iptr_ij],fc->matrix->mainBlock->val[iptr_ji]);  
                                 B->mainBlock->val[iptr_ij]+=alpha*fc->matrix->mainBlock->val[iptr_ij]+d_ij;  
                                 B->mainBlock->val[iptr_ji]+=alpha*fc->matrix->mainBlock->val[iptr_ji]+d_ij;  
                                 B->mainBlock->val[fc->main_iptr[i]]-=d_ij;  
                                 B->mainBlock->val[fc->main_iptr[j]]-=d_ij;  
                                 break;  
                             }  
                         }  
                      }  
                           
                   }  
                   /* TODO process couple block */  
                }  
            }  
            #pragma omp barrier  
        }  
   }  
   
 }  
 /**************************************************************/  
   
 /* adds antidiffusion to fa    
   
    P_p[i] + = sum_j min(0,a[i,j]) min(0,u[j]-u[i])    
    P_n[i] + = sum_j min(0,a[i,j]) max(0,u[j]-u[i])    
    Q_p[i] + = sum_j max(0,a[i,j]) max(0,u[j]-u[i])    
    Q_n[i] + = sum_j max(0,a[i,j]) min(0,u[j]-u[i])    
    d_ij=max(0,-a[i,j],-a[j,i])  
    l_ji=max(0,a[j,i],a[j,i]-a[i,j])  
    if a[j,i] >= a[i,j] and 0>a[i,j] : (i.e d_ij>0 and l_ji>=l_ij)  
       r_ij = u[i]>u[j] ? Q_p[i]/P_p[i] : Q_n[i]/Q_n[i]  
       f_ij =min(FLUX_LIMITER(r_ij)*d_ij,l_ji) (u[i]-u[j])=min(FLUX_LIMITER(r_ij)*a[i,j],a[j,i]-a[i,j]) (u[i]-u[j])  
       fa[i]+=f_ij  
       fa[j]-=f_ij  
   
 */  
   
 void Paso_Solver_FluxControl_setAntiDiffusiveFlux(Paso_Solver_FluxControl * fc, double * u, double* fa) {  
   
   register double u_i,P_p,P_n,Q_p,Q_n,r_p,r_n, a_ij, d, u_j, r_ij, f_ij, a_ji;  
   double *u_remote=NULL;  
   index_t color, iptr_ij,j,iptr_ji, i;  
   dim_t n;  
   
   
   if (fc==NULL) return;  
   n=Paso_SystemMatrix_getTotalNumRows(fc->matrix);  
   /* exchange */  
   Paso_SystemMatrix_startCollect(fc->matrix,u);  
   u_remote=Paso_SystemMatrix_finishCollect(fc->matrix);  
   
   #pragma omp parallel private(color)  
   {  
        for (color=0;color<fc->num_colors;++color) {  
            #pragma omp for schedule(static) private(i, u_i,P_p,P_n,Q_p,Q_n,r_p,r_n,iptr_ij,a_ij,d,j,iptr_ji, u_j, r_ij, f_ij, a_ji)  
            for (i = 0; i < n; ++i) {  
               if (fc->colorOf[i]==color) {  
                   u_i=u[i];  
                   /* gather the smoothness sensor */  
                   P_p=0.;  
                   P_n=0.;  
                   Q_p=0.;  
                   Q_n=0.;  
                   #pragma ivdep  
               for (iptr_ij=(fc->matrix->mainBlock->pattern->ptr[i]);iptr_ij<(fc->matrix->mainBlock->pattern->ptr[i+1]); ++iptr_ij) {  
                       a_ij=fc->matrix->mainBlock->val[iptr_ij];  
                       j=fc->matrix->mainBlock->pattern->index[iptr_ij];  
                       d=u[j]-u_i;  
                       if (a_ij<0.) {  
                          if (d<0.) {  
                             P_p+=a_ij*d;  
                          } else {  
                             P_n+=a_ij*d;  
                          }  
                       } else {  
                          if (d>0.) {  
                             Q_p+=a_ij*d;  
                          } else {  
                             Q_n+=a_ij*d;  
                          }  
                       }  
               }  
                   #pragma ivdep  
               for (iptr_ij=(fc->matrix->coupleBlock->pattern->ptr[i]);iptr_ij<(fc->matrix->coupleBlock->pattern->ptr[i+1]); ++iptr_ij) {  
                       a_ij=fc->matrix->coupleBlock->val[iptr_ij];  
                       j=fc->matrix->coupleBlock->pattern->index[iptr_ij];  
                       d=u_remote[j]-u_i;  
                       if (a_ij<0.) {  
                          if (d<0.) {  
                             P_p+=a_ij*d;  
                          } else {  
                             P_n+=a_ij*d;  
                          }  
                       } else {  
                          if (d>0.) {  
                             Q_p+=a_ij*d;  
                          } else {  
                             Q_n+=a_ij*d;  
                          }  
                       }  
               }  
                   /* set the smoothness indicators */  
                   r_p = (P_p > 0.) ? FLUX_LIMITER(Q_p/P_p) : 0.;  
                   r_n = (P_n < 0 ) ? FLUX_LIMITER(Q_n/P_n) : 0.;  
                   /* anti diffusive flux from main block */  
                   for (iptr_ij=fc->matrix->mainBlock->pattern->ptr[i];iptr_ij<fc->matrix->mainBlock->pattern->ptr[i+1]; ++iptr_ij) {  
                      a_ij=fc->matrix->mainBlock->val[iptr_ij];  
                      j=fc->matrix->mainBlock->pattern->index[iptr_ij];  
                      if (a_ij < 0 && i!=j) {  
                         /* find entry a[j,i] */  
                         for (iptr_ji=fc->matrix->mainBlock->pattern->ptr[i];iptr_ji<fc->matrix->mainBlock->pattern->ptr[j+1]-1; ++iptr_ji) {  
                             if (fc->matrix->mainBlock->pattern->index[iptr_ji]==i) {  
                                 a_ji=fc->matrix->mainBlock->val[iptr_ji];  
                                 if  (a_ji > a_ij || (a_ji == a_ij && j<i) ) {  
                                     u_j=u[j];  
                                     r_ij = u_i>u_j ? r_p : r_n;  
                                     f_ij =MIN(r_ij*a_ij,a_ji-a_ij)*(u_i-u_j);  
                                     fa[i]+=f_ij;  
                                     fa[j]-=f_ij;  
                                     break;  
                                 }  
                             }  
                         }  
                      }  
                   }  
                   /* anti diffusive flux from couple block */  
   
                   /* TODO */  
               }  
            }  
            #pragma omp barrier  
        }  
   }  
 }  

Legend:
Removed from v.1361  
changed lines
  Added in v.1363

  ViewVC Help
Powered by ViewVC 1.1.26