/[escript]/trunk/paso/src/Solver_AMG.c
ViewVC logotype

Diff of /trunk/paso/src/Solver_AMG.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1880 by jfenwick, Mon Oct 13 00:18:55 2008 UTC revision 1881 by artak, Tue Oct 14 04:34:09 2008 UTC
# Line 73  Paso_Solver_AMG* Paso_Solver_getAMG(Paso Line 73  Paso_Solver_AMG* Paso_Solver_getAMG(Paso
73    dim_t n=A_p->numRows;    dim_t n=A_p->numRows;
74    dim_t n_block=A_p->row_block_size;    dim_t n_block=A_p->row_block_size;
75    index_t* mis_marker=NULL;      index_t* mis_marker=NULL;  
76    index_t* counter=NULL;      index_t* counter=NULL;
77    index_t iPtr,*index, *where_p;    double *rs=NULL;  
78    dim_t i,k;    index_t iPtr,*index, *where_p, iPtr_s;
79      dim_t i,k,j,j0;
80    Paso_SparseMatrix * schur=NULL;    Paso_SparseMatrix * schur=NULL;
81      Paso_SparseMatrix * schur_withFillIn=NULL;
82      schur_withFillIn=MEMALLOC(1,Paso_SparseMatrix);
83      
84      
85    double A11,A12,A13,A21,A22,A23,A31,A32,A33,D,time0,time1,time2;    double A11,A12,A13,A21,A22,A23,A31,A32,A33,D,time0,time1,time2;
86        
87    
88    /* identify independend set of rows/columns */    /* identify independend set of rows/columns */
89    mis_marker=TMPMEMALLOC(n,index_t);    mis_marker=TMPMEMALLOC(n,index_t);
90    counter=TMPMEMALLOC(n,index_t);    counter=TMPMEMALLOC(n,index_t);
91      rs=TMPMEMALLOC(n,double);
92    out=MEMALLOC(1,Paso_Solver_AMG);    out=MEMALLOC(1,Paso_Solver_AMG);
93    out->AMG_of_Schur=NULL;    out->AMG_of_Schur=NULL;
94    out->inv_A_FF=NULL;    out->inv_A_FF=NULL;
# Line 97  Paso_Solver_AMG* Paso_Solver_getAMG(Paso Line 103  Paso_Solver_AMG* Paso_Solver_getAMG(Paso
103    out->b_F=NULL;    out->b_F=NULL;
104    out->x_C=NULL;    out->x_C=NULL;
105    out->b_C=NULL;    out->b_C=NULL;
106      
107     /* fprintf(stderr,"START OF MATRIX \n\n");
108      for (i = 0; i < A_p->numRows; ++i) {
109         for (iPtr=A_p->pattern->ptr[i];iPtr<A_p->pattern->ptr[i + 1]; ++iPtr) {
110           j=A_p->pattern->index[iPtr];
111           fprintf(stderr,"A[%d,%d]=%.2f ",i,j,A_p->val[iPtr]);
112         }
113         fprintf(stderr,"\n");
114       }
115       fprintf(stderr,"END OF MATRIX \n\n");
116     */
117    if ( !(Paso_checkPtr(mis_marker) || Paso_checkPtr(out) || Paso_checkPtr(counter) ) ) {    if ( !(Paso_checkPtr(mis_marker) || Paso_checkPtr(out) || Paso_checkPtr(counter) ) ) {
118       /* identify independend set of rows/columns */       /* identify independend set of rows/columns */
119       time0=Paso_timer();       time0=Paso_timer();
120       #pragma omp parallel for private(i) schedule(static)       #pragma omp parallel for private(i) schedule(static)
121       for (i=0;i<n;++i) mis_marker[i]=-1;       for (i=0;i<n;++i) mis_marker[i]=-1;
122       Paso_Pattern_mis(A_p->pattern,mis_marker);       Paso_Pattern_coup(A_p,mis_marker);
123       time2=Paso_timer()-time0;       time2=Paso_timer()-time0;
124       if (Paso_noError()) {       if (Paso_noError()) {
125          #pragma omp parallel for private(i) schedule(static)          #pragma omp parallel for private(i) schedule(static)
# Line 130  Paso_Solver_AMG* Paso_Solver_getAMG(Paso Line 146  Paso_Solver_AMG* Paso_Solver_getAMG(Paso
146                          out->mask_F[i]=-1;                          out->mask_F[i]=-1;
147                   }                   }
148                }                }
149                  /* Compute row-sum for getting rs(A_FF)*/
150                  #pragma omp for private(i,iPtr) schedule(static)
151                  for (i = 0; i < out->n_F; ++i) {
152                    rs[i]=0;
153                    for (iPtr=A_p->pattern->ptr[out->rows_in_F[i]];iPtr<A_p->pattern->ptr[out->rows_in_F[i] + 1]; ++iPtr) {
154                     rs[i]+=A_p->val[iPtr];
155                    }
156                  }
157                
158                #pragma omp for private(i, where_p,iPtr,A11,A12,A13,A21,A22,A23,A31,A32,A33,D,index) schedule(static)                #pragma omp for private(i, where_p,iPtr,A11,A12,A13,A21,A22,A23,A31,A32,A33,D,index) schedule(static)
159                for (i = 0; i < out->n_F; i++) {                for (i = 0; i < out->n_F; i++) {
160                  /* find main diagonal */                  /* find main diagonal */
# Line 145  Paso_Solver_AMG* Paso_Solver_getAMG(Paso Line 170  Paso_Solver_AMG* Paso_Solver_getAMG(Paso
170                  } else {                  } else {
171                      iPtr+=(index_t)(where_p-index);                      iPtr+=(index_t)(where_p-index);
172                      /* get inverse of A_FF block: */                      /* get inverse of A_FF block: */
173                      if (n_block==1) {                        if (ABS(rs[i])>0.) {
174                         if (ABS(A_p->val[iPtr])>0.) {                              out->inv_A_FF[i]=1./rs[i];
175                              out->inv_A_FF[i]=1./A_p->val[iPtr];                        } else {
                        } else {  
176                              Paso_setError(ZERO_DIVISION_ERROR, "Paso_Solver_getAMG: Break-down in AMG decomposition: non-regular main diagonal block.");                              Paso_setError(ZERO_DIVISION_ERROR, "Paso_Solver_getAMG: Break-down in AMG decomposition: non-regular main diagonal block.");
177                         }                        }
178                      } else if (n_block==2) {                  }
                        A11=A_p->val[iPtr*4];  
                        A21=A_p->val[iPtr*4+1];  
                        A12=A_p->val[iPtr*4+2];  
                        A22=A_p->val[iPtr*4+3];  
                        D = A11*A22-A12*A21;  
                        if (ABS(D) > 0 ){  
                             D=1./D;  
                             out->inv_A_FF[i*4]= A22*D;  
                             out->inv_A_FF[i*4+1]=-A21*D;  
                             out->inv_A_FF[i*4+2]=-A12*D;  
                             out->inv_A_FF[i*4+3]= A11*D;  
                        } else {  
                             Paso_setError(ZERO_DIVISION_ERROR, "Paso_Solver_getAMG:Break-down in AMG decomposition: non-regular main diagonal block.");  
                        }  
                     } else if (n_block==3) {  
                        A11=A_p->val[iPtr*9  ];  
                        A21=A_p->val[iPtr*9+1];  
                        A31=A_p->val[iPtr*9+2];  
                        A12=A_p->val[iPtr*9+3];  
                        A22=A_p->val[iPtr*9+4];  
                        A32=A_p->val[iPtr*9+5];  
                        A13=A_p->val[iPtr*9+6];  
                        A23=A_p->val[iPtr*9+7];  
                        A33=A_p->val[iPtr*9+8];  
                        D  =  A11*(A22*A33-A23*A32)+ A12*(A31*A23-A21*A33)+A13*(A21*A32-A31*A22);  
                        if (ABS(D) > 0 ){  
                             D=1./D;  
                             out->inv_A_FF[i*9  ]=(A22*A33-A23*A32)*D;  
                             out->inv_A_FF[i*9+1]=(A31*A23-A21*A33)*D;  
                             out->inv_A_FF[i*9+2]=(A21*A32-A31*A22)*D;  
                             out->inv_A_FF[i*9+3]=(A13*A32-A12*A33)*D;  
                             out->inv_A_FF[i*9+4]=(A11*A33-A31*A13)*D;  
                             out->inv_A_FF[i*9+5]=(A12*A31-A11*A32)*D;  
                             out->inv_A_FF[i*9+6]=(A12*A23-A13*A22)*D;  
                             out->inv_A_FF[i*9+7]=(A13*A21-A11*A23)*D;  
                             out->inv_A_FF[i*9+8]=(A11*A22-A12*A21)*D;  
                        } else {  
                             Paso_setError(ZERO_DIVISION_ERROR, "Paso_Solver_getAMG:Break-down in AMG decomposition: non-regular main diagonal block.");  
                        }  
                    }  
                 }  
179                }                }
180             } /* end parallel region */             } /* end parallel region */
181    
# Line 226  Paso_Solver_AMG* Paso_Solver_getAMG(Paso Line 209  Paso_Solver_AMG* Paso_Solver_getAMG(Paso
209                        if (Paso_noError()) {                        if (Paso_noError()) {
210                           /* get A_FC block: */                           /* get A_FC block: */
211                           out->A_FC=Paso_SparseMatrix_getSubmatrix(A_p,out->n_F,out->n_C,out->rows_in_F,out->mask_C);                           out->A_FC=Paso_SparseMatrix_getSubmatrix(A_p,out->n_F,out->n_C,out->rows_in_F,out->mask_C);
212                           /* get A_FF block: */                           /* get A_CC block: */
213                           if (Paso_noError()) {                           if (Paso_noError()) {
214                              schur=Paso_SparseMatrix_getSubmatrix(A_p,out->n_C,out->n_C,out->rows_in_C,out->mask_C);                              schur=Paso_SparseMatrix_getSubmatrix(A_p,out->n_C,out->n_C,out->rows_in_C,out->mask_C);
215                                
216                                /*find the pattern of the schur complement with fill in*/
217                                schur_withFillIn=Paso_SparseMatrix_alloc(A_p->type,Paso_Pattern_binop(PATTERN_FORMAT_DEFAULT, schur->pattern, Paso_Pattern_multiply(PATTERN_FORMAT_DEFAULT,out->A_CF->pattern,out->A_FC->pattern)),1,1);
218                                
219                                /* copy values over*/
220                                #pragma omp for private(i,iPtr,iPtr_s,j,j0) schedule(static)
221                                for (i = 0; i < schur_withFillIn->numRows; ++i) {
222                                  for (iPtr=schur_withFillIn->pattern->ptr[i];iPtr<schur_withFillIn->pattern->ptr[i + 1]; ++iPtr) {
223                                    j=schur_withFillIn->pattern->index[iPtr];
224                                    schur_withFillIn->val[iPtr]=0.;
225                                    for (iPtr_s=schur->pattern->ptr[i];iPtr_s<schur->pattern->ptr[i + 1]; ++iPtr_s){
226                                        j0=schur->pattern->index[iPtr_s];
227                                        if (j==j0) {
228                                          schur_withFillIn->val[iPtr]=schur->val[iPtr_s];
229                                          break;
230                                        }
231                                    }
232                                  }
233                                }
234                                
235                              /*  for (i = 0; i < schur_withFillIn->numRows; ++i) {
236                                  for (iPtr=schur_withFillIn->pattern->ptr[i];iPtr<schur_withFillIn->pattern->ptr[i + 1]; ++iPtr) {
237                                    j=schur_withFillIn->pattern->index[iPtr];
238                                    fprintf(stderr,"A_CC[%d,%d]=%.2f ",i,j,schur_withFillIn->val[iPtr]);
239                                  }
240                                  fprintf(stderr,"\n");
241                                }*/
242                              time0=Paso_timer()-time0;                              time0=Paso_timer()-time0;
243                              if (Paso_noError()) {                              if (Paso_noError()) {
244                                  time1=Paso_timer();                                  time1=Paso_timer();
245                                  /* update A_CC block to get Schur complement and then apply AMG to it */                                  /* update A_CC block to get Schur complement and then apply AMG to it */
246                                  Paso_Solver_updateIncompleteSchurComplement(schur,out->A_CF,out->inv_A_FF,out->A_FF_pivot,out->A_FC);                                  Paso_Solver_updateIncompleteSchurComplement(schur_withFillIn,out->A_CF,out->inv_A_FF,out->A_FF_pivot,out->A_FC);
247                                  time1=Paso_timer()-time1;                                  time1=Paso_timer()-time1;
248                                  out->AMG_of_Schur=Paso_Solver_getAMG(schur,verbose);                                  out->AMG_of_Schur=Paso_Solver_getAMG(schur_withFillIn,verbose);
249                                    
250                                  Paso_SparseMatrix_free(schur);                                  Paso_SparseMatrix_free(schur);
251                                    Paso_SparseMatrix_free(schur_withFillIn);
252                              }                              }
253                              /* allocate work arrays for AMG application */                              /* allocate work arrays for AMG application */
254                              if (Paso_noError()) {                              if (Paso_noError()) {
# Line 274  Paso_Solver_AMG* Paso_Solver_getAMG(Paso Line 286  Paso_Solver_AMG* Paso_Solver_getAMG(Paso
286    }    }
287    TMPMEMFREE(mis_marker);    TMPMEMFREE(mis_marker);
288    TMPMEMFREE(counter);    TMPMEMFREE(counter);
289      TMPMEMFREE(rs);
290    if (Paso_noError()) {    if (Paso_noError()) {
291        if (verbose) {        if (verbose) {
292           printf("AMG: %d unknowns eliminated. %d left.\n",out->n_F,n-out->n_F);           printf("AMG: %d unknowns eliminated. %d left.\n",out->n_F,n-out->n_F);
# Line 317  Paso_Solver_AMG* Paso_Solver_getAMG(Paso Line 330  Paso_Solver_AMG* Paso_Solver_getAMG(Paso
330  void Paso_Solver_solveAMG(Paso_Solver_AMG * amg, double * x, double * b) {  void Paso_Solver_solveAMG(Paso_Solver_AMG * amg, double * x, double * b) {
331       dim_t i,k;       dim_t i,k;
332       dim_t n_block=amg->n_block;       dim_t n_block=amg->n_block;
333        
334       if (amg->n_C==0) {       if (amg->n_C==0) {
335          /* x=invA_FF*b  */          /* x=invA_FF*b  */
336          Paso_Solver_applyBlockDiagonalMatrix(n_block,amg->n_F,amg->inv_A_FF,amg->A_FF_pivot,x,b);          Paso_Solver_applyBlockDiagonalMatrix(n_block,amg->n_F,amg->inv_A_FF,amg->A_FF_pivot,x,b);
337       } else {       } else {
338            /* presmoothing on (Shure, x, b, r) */
339          /* b->[b_F,b_C]     */          /* b->[b_F,b_C]     */
340          if (n_block==1) {          if (n_block==1) {
341             #pragma omp parallel for private(i) schedule(static)             #pragma omp parallel for private(i) schedule(static)

Legend:
Removed from v.1880  
changed lines
  Added in v.1881

  ViewVC Help
Powered by ViewVC 1.1.26