/[escript]/trunk/paso/src/SolverFCT_solve.c
ViewVC logotype

Diff of /trunk/paso/src/SolverFCT_solve.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1370 by gross, Wed Jan 2 09:21:43 2008 UTC revision 1513 by gross, Tue Apr 15 08:47:57 2008 UTC
# Line 2  Line 2 
2    
3  /*******************************************************  /*******************************************************
4   *   *
5   *       Copyright 2007 by University of Queensland   *       Copyright 2007,2008 by University of Queensland
6   *   *
7   *                http://esscc.uq.edu.au   *                http://esscc.uq.edu_m.au
8   *        Primary Business: Queensland, Australia   *        Primary Business: Queensland, Australia
9   *  Licensed under the Open Software License version 3.0   *  Licensed under the Open Software License version 3.0
10   *     http://www.opensource.org/licenses/osl-3.0.php   *     http://www.opensource.org/licenses/osl-3.0.php
# Line 15  Line 15 
15    
16  /* Paso: Flux correction transport solver  /* Paso: Flux correction transport solver
17   *   *
18   * solves Mu_t=Du+Ku+q   * solves Mu_t=Ku+q
19     *        u(0) >= u_min
20   *   *
21   *  where is D is diffusive (not checked)   * Warning: the program assums sum_{j} k_{ij}=0!!!
  *          - D is symmetric  
  *          - row sums are equal to zero.  
  *  and  K is the advective part.  
  *  
  *        u(0) >= 0  
  *  
  * intially fctp->transport_matrix defines the diffusive part  
  * but the matrix is updated by the adevctive part + artificial diffusion  
22   *   *
23  */  */
24  /**************************************************************/  /**************************************************************/
25    
26  /* Author: l.gross@uq.edu.au */  /* Author: l.gross@uq.edu_m.au */
27    
28  /**************************************************************/  /**************************************************************/
29    
# Line 45  Line 38 
38  #include <mpi.h>  #include <mpi.h>
39  #endif  #endif
40    
41  /***********************************************************************************  double Paso_FCTransportProblem_getSafeTimeStepSize(Paso_FCTransportProblem* fctp)
42    {
43          solve (until convergence)     dim_t i, n_rows;
44       double dt_max, dt_max_loc;
45          (*)  [M-theta*dt*L] du = M*u_last + (1-theta)*dt*F(u_last) - M*u + theta*dt F(u)     register double rtmp1,rtmp2;
46               u <- u+du     n_rows=Paso_SystemMatrix_getTotalNumRows(fctp->transport_matrix);
   
         with F(u) =  L u + f_a(u)  (f_a anti-diffusion)  
         and L = D + K + D_K  stored in transport_matrix  
             D = Diffusive part (on input stored in transport_matrix)  
             K = flux_matrix  
             D_K = artificial diffusion introduced by K  
             f_a = anti-diffusion introduced by K and u  
             u_last=u of last time step  
   
         For the case theta==0 (explicit case) no iteration is required. One sets  
   
               M*u= M*u_last + dt*F(u_last)  
   
         with F(u) =  L u + f_a(u).  
   
   
         For the case theta>0 we set  
   
             A=L-M/(theta*dt) (stored into transport_matrix)  
             F(u)=L u + f_a(u) = M/(theta*dt) u + A u + f_a(u)  
             b(u)= - M/(theta*dt) * u + F(u) =  A u + f_a(u)  
             b_last=M/(theta*dt)*u_last + (1-theta)*dt * F(u_last)  
                   =M/(theta*dt)*u_last + (1-theta)/theta * [ M/(theta*dt) u_last + A u_last + f_a(u_last) ]  
                   =(1/theta**2*dt)*M u_last + (1-theta)/theta*b(u_last)  
         so (*) takes the form  
   
         b_last=(1/theta**2*dt)*M u_last + (1-theta)/theta*b(u_last)  
         while (|du| > tol * |u|) :  
              A*du=b_last + b(u)  
              u <- u-du        
   
 */  
   
 void Paso_SolverFCT_solve(Paso_FCTransportProblem* fctp, double* u, double dt, double* source, Paso_Options* options) {  
   
    index_t i;  
    int n_substeps,n;  
    double dt2=fctp->dt_max, dt2_loc, rtmp,rtmp2,t;  
    printf("FFFF %e",fctp->dt_max);  
    if (dt<=0.) {  
        Paso_setError(TYPE_ERROR,"Paso_SolverFCT_solve: dt must be positive.");  
    }  
47     if (! fctp->valid_matrices) {     if (! fctp->valid_matrices) {
48            fctp->dt_max=LARGE_POSITIVE_FLOAT;
49          /* extract the row sum of the advective part */          /* extract the row sum of the advective part */
50          Paso_SystemMatrix_rowSum(fctp->flux_matrix,fctp->row_sum_flux_matrix);          Paso_SystemMatrix_rowSum(fctp->mass_matrix,fctp->lumped_mass_matrix);
         /* add the advective part + artificial diffusion to the diffusive part = transport-matrix */  
         Paso_FCTransportProblem_addAdvectivePart(fctp,1.);  
         /* create a copy of the main diagonal entires of the transport-matrix */  
         #pragma omp parallel for schedule(static) private(i)  
         for (i=0;i<Paso_SystemMatrix_getTotalNumRows(fctp->flux_matrix);++i) {  
                fctp->transport_matrix_diagonal[i]=  
                         fctp->transport_matrix->mainBlock->val[fctp->main_iptr[i]];  
         }  
51    
52  Paso_SystemMatrix_saveMM(fctp->flux_matrix,"flux.mm");          /* set low order transport operator */
53  Paso_SystemMatrix_saveMM(fctp->transport_matrix,"trans.mm");          Paso_FCTransportProblem_setLowOrderOperator(fctp);
54          /*=================================================================== *          /*
          *  
55           *  calculate time step size:                                                     *  calculate time step size:                                          
56           */          */
57          dt2=fctp->dt_max;          dt_max=LARGE_POSITIVE_FLOAT;
58          if (fctp->theta < 1.) {          if (fctp->theta < 1.) {
59              dt2=LARGE_POSITIVE_FLOAT;              #pragma omp parallel private(dt_max_loc)
             #pragma omp parallel private(dt2_loc)  
60              {              {
61                 dt2_loc=LARGE_POSITIVE_FLOAT;                 dt_max_loc=LARGE_POSITIVE_FLOAT;
62                 #pragma omp for schedule(static) private(i,rtmp,rtmp2)                 #pragma omp for schedule(static) private(i,rtmp1,rtmp2)
63                 for (i=0;i<Paso_SystemMatrix_getTotalNumRows(fctp->flux_matrix);++i) {                 for (i=0;i<n_rows;++i) {
64                      rtmp=fctp->transport_matrix_diagonal[i];                      rtmp1=fctp->main_diagonal_low_order_transport_matrix[i];
65                      rtmp2=fctp->lumped_mass_matrix[i];                      rtmp2=fctp->lumped_mass_matrix[i];
66                      if ( (rtmp<0 && rtmp2>=0.) || (rtmp>0 && rtmp2<=0.) ) {                      if ( (rtmp1<0 && rtmp2>0.) || (rtmp1>0 && rtmp2<0.) ) {
67                          dt2_loc=MIN(dt2_loc,-rtmp2/rtmp);                          dt_max_loc=MIN(dt_max_loc,-rtmp2/rtmp1);
68                      }                      }
69                  }                  }
70                  #pragma omp critcal                  #pragma omp critical
71                  {                  {
72                      dt2=MIN(dt2,dt2_loc);                      dt_max=MIN(dt_max,dt_max_loc);
73                  }                  }
74              }              }
75              #ifdef PASO_MPI              #ifdef PASO_MPI
76                 dt2_loc = dt2;                 dt_max_loc = dt_max;
77             MPI_Allreduce(&dt2_loc, &dt2, 1, MPI_DOUBLE, MPI_MIN, fctp->mpi_info->comm);             MPI_Allreduce(&dt_max_loc, &dt_max, 1, MPI_DOUBLE, MPI_MIN, fctp->mpi_info->comm);
78              #endif               #endif
79              dt2*=1./(1.-fctp->theta);               if (dt_max<LARGE_POSITIVE_FLOAT) dt_max*=1./(1.-fctp->theta);
80              if (fctp->dt_max>0.) dt2=MIN(dt2,fctp->dt_max);           }
81          }           if (dt_max <= 0.)  {
82          if (dt2 > 0.) {              Paso_setError(TYPE_ERROR,"Paso_SolverFCT_solve: dt must be positive.");
83           fctp->dt=dt2;           } else {
84          } else {             if (dt_max<LARGE_POSITIVE_FLOAT) printf("maximum time step size is %e (theta = %e).\n",dt_max,fctp->theta);  
          fctp->dt=fctp->dt_max;  
         }  
         if (fctp->dt < 0.) {  
             Paso_setError(TYPE_ERROR,"Paso_SolverFCT_solve: dt_max must be positive.");  
         } else {  
            printf("minimum time step size is %e (theta = %e).\n",fctp->dt,fctp->theta);    
         }  
         /* ===========================================================  
          *  
          *      
         */  
         if (Paso_noError()) {  
   
85          }          }
86            fctp->dt_max=dt_max;
87          fctp->valid_matrices=Paso_noError();          fctp->valid_matrices=Paso_noError();
88     }     }
89       return fctp->dt_max;
90    }
91    
    /* b_last=M*u_last + (1-theta) * F(u_last) */  
92    
93     /* decide on substepping */  
94     n_substeps=ceil(dt/fctp->dt);  
95     dt2=dt/n_substeps;  void Paso_SolverFCT_solve(Paso_FCTransportProblem* fctp, double* u, double dt, double* source, Paso_Options* options) {
96     printf("%d time steps of size is %e (theta = %e, dt_max=%e).\n",n_substeps, dt2,fctp->theta,fctp->dt);  
97       index_t i, j;
98     /* */     int n_substeps,n, m;
99     Paso_SystemMatrix_allocBuffer(fctp->transport_matrix);     double dt_max, omega, dt2,t;
100       double local_norm[2],norm[2],local_norm_u,local_norm_du,norm_u,norm_du, tolerance;
101     if (fctp->theta>0) {     register double rtmp1,rtmp2,rtmp3,rtmp4, rtmp;
102          #pragma omp parallel for schedule(static) private(i)     double *b_n=NULL, *sourceP=NULL, *sourceN=NULL, *uTilde_n=NULL, *QN_n=NULL, *QP_n=NULL, *RN_m=NULL, *RP_m=NULL, *z_m=NULL, *du_m=NULL;
103          for (i=0;i<Paso_SystemMatrix_getTotalNumRows(fctp->flux_matrix);++i) {     Paso_SystemMatrix *flux_matrix=NULL;
104                 fctp->transport_matrix_diagonal[i]=     dim_t n_rows=Paso_SystemMatrix_getTotalNumRows(fctp->transport_matrix);
105                          fctp->transport_matrix->mainBlock->val[fctp->main_iptr[i]];     bool_t converged;
106       if (dt<=0.) {
107           Paso_setError(TYPE_ERROR,"Paso_SolverFCT_solve: dt must be positive.");
108       }
109       dt_max=Paso_FCTransportProblem_getSafeTimeStepSize(fctp);
110       /*
111        *  allocate memory
112        *
113        */
114       Paso_SystemMatrix_allocBuffer(fctp->iteration_matrix);
115       b_n=TMPMEMALLOC(n_rows,double);
116       Paso_checkPtr(b_n);
117       sourceP=TMPMEMALLOC(n_rows,double);
118       Paso_checkPtr(sourceP);
119       sourceN=TMPMEMALLOC(n_rows,double);
120       Paso_checkPtr(sourceN);
121       uTilde_n=TMPMEMALLOC(n_rows,double);
122       Paso_checkPtr(uTilde_n);
123       QN_n=TMPMEMALLOC(n_rows,double);
124       Paso_checkPtr(QN_n);
125       QP_n=TMPMEMALLOC(n_rows,double);
126       Paso_checkPtr(QP_n);
127       RN_m=TMPMEMALLOC(n_rows,double);
128       Paso_checkPtr(RN_m);
129       RP_m=TMPMEMALLOC(n_rows,double);
130       Paso_checkPtr(RP_m);
131       z_m=TMPMEMALLOC(n_rows,double);
132       Paso_checkPtr(z_m);
133       du_m=TMPMEMALLOC(n_rows,double);
134       Paso_checkPtr(du_m);
135       flux_matrix=Paso_SystemMatrix_alloc(fctp->transport_matrix->type,
136                                           fctp->transport_matrix->pattern,
137                                           fctp->transport_matrix->row_block_size,
138                                           fctp->transport_matrix->col_block_size);
139       if (Paso_noError()) {
140           Paso_SystemMatrix_allocBuffer(flux_matrix);
141           Paso_SystemMatrix_allocBuffer(fctp->iteration_matrix);
142           /*
143            *    Preparation:
144            *
145            */
146        
147           /* decide on substepping */
148           if (fctp->dt_max < LARGE_POSITIVE_FLOAT) {
149              n_substeps=ceil(dt/dt_max);
150           } else {
151              n_substeps=1;
152           }
153           dt2=dt/n_substeps;
154           printf("%d time steps of size is %e (theta = %e, dt_max=%e).\n",n_substeps, dt2,fctp->theta, dt_max);
155           /*
156        * seperate source into positive and negative part:
157        */
158            #pragma omp parallel for private(i,rtmp)
159            for (i = 0; i < n_rows; ++i) {
160              rtmp=source[i];
161              if (rtmp <0) {
162                 sourceN[i]=-rtmp;
163                 sourceP[i]=0;
164              } else {
165                 sourceN[i]= 0;
166                 sourceP[i]= rtmp;
167              }
168          }          }
169     } else {  /*        for (i = 0; i < n_rows; ++i) printf("%d : %e \n",i,source[i],sourceP[i],sourceN[i]) */
170        /* u= u_last + M^-1*dt*F(u_last) */          /*
171        t=dt2;           * let the show begin!!!!
172        n=0;           *
173        while(n<n_substeps) {           */
174          printf("substep step %d at t=%e\n",n+1,t);          t=dt2;
175          Paso_FCTransportProblem_setFlux(fctp,fctp->u,u); /* u stores F(u_last)*/          n=0;
176          #pragma omp parallel for schedule(static) private(i)          tolerance=options->tolerance;
177          for (i=0;i<Paso_SystemMatrix_getTotalNumRows(fctp->flux_matrix);++i) {          while(n<n_substeps && Paso_noError()) {
178              rtmp=fctp->u[i];              printf("substep step %d at t=%e\n",n+1,t);
179              fctp->u[i]=fctp->u[i]+dt2*u[i]/fctp->lumped_mass_matrix[i];              #pragma omp parallel for private(i)
180              printf("%d : %e %e %e\n",i,u[i],fctp->u[i],rtmp);               for (i = 0; i < n_rows; ++i) {
181                          u[i]=fctp->u[i];
182                 }
183                /*
184                 * b^n[i]=m u^n[i] + dt2*(1-theta) sum_{j <> i} l_{ij}*(u^n[j]-u^n[i]) + dt2*sourceP[i]
185                 *
186                 * note that iteration_matrix stores the negative values of the
187                 * low order transport matrix l therefore a=-dt2*(1-fctp->theta) is used.
188                 *
189                 */
190                 Paso_SolverFCT_setMuPaLuPbQ(b_n,fctp->lumped_mass_matrix,u,
191                                              -dt2*(1-fctp->theta),fctp->iteration_matrix,dt2,sourceP);
192                 /*
193              *   uTilde_n[i]=b[i]/m[i]
194              *
195              *   a[i,i]=m[i]/(dt2 theta) + \frac{1}{\theta} \frac{q^-[i]}-l[i,i]
196              *
197              */
198                 if (fctp->theta > 0) {
199                     Paso_solve_free(fctp->iteration_matrix);
200                     omega=1./(dt2*fctp->theta);
201                     rtmp2=dt2*omega;
202                     #pragma omp parallel for private(i,rtmp,rtmp3,rtmp4)
203                     for (i = 0; i < n_rows; ++i) {
204                          rtmp=fctp->lumped_mass_matrix[i];
205                          if (ABS(rtmp)>0.) {
206                             rtmp3=b_n[i]/rtmp;
207                          } else {
208                             rtmp3=u[i];
209                          }
210                          rtmp4=rtmp*omega-fctp->main_diagonal_low_order_transport_matrix[i];
211                          if (ABS(rtmp3)>0) rtmp4+=sourceN[i]*rtmp2/rtmp3;
212                          fctp->iteration_matrix->mainBlock->val[fctp->main_iptr[i]]=rtmp4;
213                          uTilde_n[i]=rtmp3;
214                     }
215                 } else {
216                     #pragma omp parallel for private(i,rtmp,rtmp3)
217                     for (i = 0; i < n_rows; ++i) {
218                          rtmp=fctp->lumped_mass_matrix[i];
219                          if (ABS(rtmp)>0.) {
220                             rtmp3=b_n[i]/rtmp;
221                          } else {
222                             rtmp3=u[i];
223                          }
224                          uTilde_n[i]=rtmp3;
225                     }
226                     omega=1.;
227                     /* no update of iteration_matrix retquired! */
228                 } /* end (fctp->theta > 0) */
229                 /*
230                  * calculate QP_n[i] max_{j} (\tilde{u}[j]- \tilde{u}[i] )
231                  *           QN_n[i] min_{j} (\tilde{u}[j]- \tilde{u}[i] )
232                  *
233                  */
234                  Paso_SolverFCT_setQs(uTilde_n,QN_n,QP_n,fctp->iteration_matrix);
235                  /*
236                   * now we enter the mation on a time-step:
237                   *
238                   */
239                   m=0;
240                   converged=FALSE;
241                   while ( (!converged) && (m<500) && Paso_noError()) {
242                        printf("iteration step %d\n",m+1);
243                        /*
244                         *  set the ant diffusion fluxes:
245                         *
246                         */
247                         Paso_FCTransportProblem_setAntiDiffusionFlux(dt2,fctp,flux_matrix,u,fctp->u);
248                        /*
249                         *  apply pre flux-correction: f_{ij}:=0 if f_{ij}*(\tilde{u}[i]- \tilde{u}[j])<=0
250                         *
251                         *  this is not entirely correct!!!!!
252                         *
253                         */
254                        Paso_FCTransportProblem_applyPreAntiDiffusionCorrection(flux_matrix,uTilde_n);
255                        /*
256                         *  set flux limms RN_m,RP_m
257                         *
258                         */
259                        Paso_FCTransportProblem_setRs(flux_matrix,fctp->lumped_mass_matrix,QN_n,QP_n,RN_m,RP_m);
260                        /*
261                         * z_m[i]=b_n[i] - (m_i*u[i] - dt2*theta*sum_{j<>i} l_{ij} (u[j]-u[i]) + dt2 q^-[i])
262                         *
263                         * note that iteration_matrix stores the negative values of the
264                         * low order transport matrix l therefore a=dt2*fctp->theta is used.
265                         */
266    
267                        Paso_SolverFCT_setMuPaLuPbQ(z_m,fctp->lumped_mass_matrix,u,
268                                                    dt2*fctp->theta,fctp->iteration_matrix,dt2,sourceN);
269                        #pragma omp parallel for private(i)
270                        for (i = 0; i < n_rows; ++i) z_m[i]=b_n[i]-z_m[i];
271    
272                         /* add corrected fluxes into z_m */
273                         Paso_FCTransportProblem_addCorrectedFluxes(z_m,flux_matrix,RN_m,RP_m);
274                         /*
275                          * now we solve the linear system to get the correction dt2:
276                          *
277                          */
278                          if (fctp->theta > 0) {
279                                /*  set the right hand side of the linear system: */
280                                options->tolerance=1.e-2;
281                                Paso_solve(fctp->iteration_matrix,du_m,z_m,options);
282                                /* TODO: check errors ! */
283                          } else {
284                                #pragma omp parallel for private(i,rtmp,rtmp1)
285                                for (i = 0; i < n_rows; ++i) {
286                                    rtmp=fctp->lumped_mass_matrix[i];
287                                    if (ABS(rtmp)>0.) {
288                                       rtmp1=z_m[i]/rtmp;
289                                    } else {
290                                       rtmp1=0;
291                                    }
292                                    du_m[i]=rtmp1;
293                                }
294                          }
295                          /*
296                           * update u and calculate norm of du_m and the new u:
297                           *
298                           */
299                           norm_u=0.;
300                           norm_du=0.;
301                           #pragma omp parallel private(local_norm_u,local_norm_du)
302                           {
303                               local_norm_u=0.;
304                               local_norm_du=0.;
305                               #pragma omp for schedule(static) private(i)
306                               for (i=0;i<n_rows;++i) {
307                                    u[i]+=omega*du_m[i];
308                                    local_norm_u=MAX(local_norm_u,ABS(u[i]));
309                                    local_norm_du=MAX(local_norm_du,ABS(du_m[i]));
310                               }
311                               #pragma omp critical
312                               {
313                                   norm_u=MAX(norm_u,local_norm_u);
314                                   norm_du=MAX(norm_du,local_norm_du);
315                               }
316                           }
317                           #ifdef PASO_MPI
318                              local_norm[0]=norm_u;
319                              local_norm[1]=norm_du;
320                          MPI_Allreduce(local_norm,norm, 2, MPI_DOUBLE, MPI_MAX, fctp->mpi_info->comm);
321                              norm_u=norm[0];
322                              norm_du=norm[1];
323                           #endif
324                           norm_du*=omega;
325                           converged=(norm_du <= tolerance * norm_u);
326                           m++;
327                           printf("iteration step %d: norm u and du_m : %e %e\n",m,norm_u,norm_du);
328                           /* TODO: check if du_m has been redu_mced */
329                        } /* end of inner iteration */
330                        #pragma omp parallel for schedule(static) private(i)
331                        for (i=0;i<n_rows;++i) fctp->u[i]=u[i];
332                        n++;
333                   } /* end of time integration */
334                   #pragma omp parallel for schedule(static) private(i)
335                   for (i=0;i<n_rows;++i) u[i]=fctp->u[i]+fctp->u_min;
336                   /* TODO: update u_min ? */
337    
338          }          }
339          t+=dt2;          /*
340          n++;           *  clean-up:
341        }           *
342    }           */
343    if (Paso_noError()) {          TMPMEMFREE(b_n);
344       #pragma omp parallel for schedule(static) private(i)          Paso_SystemMatrix_free(flux_matrix);
345       for (i=0;i<Paso_SystemMatrix_getTotalNumRows(fctp->flux_matrix);++i) {          TMPMEMFREE(sourceP);
346         u[i]=fctp->u[i];          TMPMEMFREE(sourceN);
347       }          TMPMEMFREE(uTilde_n);
348    }          TMPMEMFREE(QN_n);
349  }                TMPMEMFREE(QP_n);
350            TMPMEMFREE(RN_m);
351            TMPMEMFREE(RP_m);
352            TMPMEMFREE(z_m);
353            TMPMEMFREE(du_m);
354    }

Legend:
Removed from v.1370  
changed lines
  Added in v.1513

  ViewVC Help
Powered by ViewVC 1.1.26