/[escript]/trunk/paso/src/Solver_AMG.c
ViewVC logotype

Diff of /trunk/paso/src/Solver_AMG.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

branches/more_shared_ptrs_from_1812/paso/src/Solver_AMG.c revision 1851 by jfenwick, Mon Oct 6 03:16:43 2008 UTC trunk/paso/src/Solver_AMG.c revision 1887 by ksteube, Wed Oct 15 03:26:25 2008 UTC
# Line 73  Paso_Solver_AMG* Paso_Solver_getAMG(Paso Line 73  Paso_Solver_AMG* Paso_Solver_getAMG(Paso
73    dim_t n=A_p->numRows;    dim_t n=A_p->numRows;
74    dim_t n_block=A_p->row_block_size;    dim_t n_block=A_p->row_block_size;
75    index_t* mis_marker=NULL;      index_t* mis_marker=NULL;  
76    index_t* counter=NULL;      index_t* counter=NULL;
77    index_t iPtr,*index, *where_p;    double *rs=NULL;  
78    dim_t i,k;    index_t iPtr,*index, *where_p, iPtr_s;
79      dim_t i,k,j,j0;
80    Paso_SparseMatrix * schur=NULL;    Paso_SparseMatrix * schur=NULL;
81      Paso_SparseMatrix * schur_withFillIn=NULL;
82    double A11,A12,A13,A21,A22,A23,A31,A32,A33,D,time0,time1,time2;    double A11,A12,A13,A21,A22,A23,A31,A32,A33,D,time0,time1,time2;
83      schur_withFillIn=MEMALLOC(1,Paso_SparseMatrix);
84        
85    
86    /* identify independend set of rows/columns */    /* identify independend set of rows/columns */
87    mis_marker=TMPMEMALLOC(n,index_t);    mis_marker=TMPMEMALLOC(n,index_t);
88    counter=TMPMEMALLOC(n,index_t);    counter=TMPMEMALLOC(n,index_t);
89      rs=TMPMEMALLOC(n,double);
90    out=MEMALLOC(1,Paso_Solver_AMG);    out=MEMALLOC(1,Paso_Solver_AMG);
91    out->AMG_of_Schur=NULL;    out->AMG_of_Schur=NULL;
92    out->inv_A_FF=NULL;    out->inv_A_FF=NULL;
# Line 97  Paso_Solver_AMG* Paso_Solver_getAMG(Paso Line 101  Paso_Solver_AMG* Paso_Solver_getAMG(Paso
101    out->b_F=NULL;    out->b_F=NULL;
102    out->x_C=NULL;    out->x_C=NULL;
103    out->b_C=NULL;    out->b_C=NULL;
104      
105     /* fprintf(stderr,"START OF MATRIX \n\n");
106      for (i = 0; i < A_p->numRows; ++i) {
107         for (iPtr=A_p->pattern->ptr[i];iPtr<A_p->pattern->ptr[i + 1]; ++iPtr) {
108           j=A_p->pattern->index[iPtr];
109           fprintf(stderr,"A[%d,%d]=%.2f ",i,j,A_p->val[iPtr]);
110         }
111         fprintf(stderr,"\n");
112       }
113       fprintf(stderr,"END OF MATRIX \n\n");
114     */
115    if ( !(Paso_checkPtr(mis_marker) || Paso_checkPtr(out) || Paso_checkPtr(counter) ) ) {    if ( !(Paso_checkPtr(mis_marker) || Paso_checkPtr(out) || Paso_checkPtr(counter) ) ) {
116       /* identify independend set of rows/columns */       /* identify independend set of rows/columns */
117       time0=Paso_timer();       time0=Paso_timer();
118       #pragma omp parallel for private(i) schedule(static)       #pragma omp parallel for private(i) schedule(static)
119       for (i=0;i<n;++i) mis_marker[i]=-1;       for (i=0;i<n;++i) mis_marker[i]=-1;
120       Paso_Pattern_mis(A_p->pattern,mis_marker);       Paso_Pattern_coup(A_p,mis_marker);
121       time2=Paso_timer()-time0;       time2=Paso_timer()-time0;
122       if (Paso_noError()) {       if (Paso_noError()) {
123          #pragma omp parallel for private(i) schedule(static)          #pragma omp parallel for private(i) schedule(static)
# Line 130  Paso_Solver_AMG* Paso_Solver_getAMG(Paso Line 144  Paso_Solver_AMG* Paso_Solver_getAMG(Paso
144                          out->mask_F[i]=-1;                          out->mask_F[i]=-1;
145                   }                   }
146                }                }
147                  /* Compute row-sum for getting rs(A_FF)*/
148                  #pragma omp for private(i,iPtr) schedule(static)
149                  for (i = 0; i < out->n_F; ++i) {
150                    rs[i]=0;
151                    for (iPtr=A_p->pattern->ptr[out->rows_in_F[i]];iPtr<A_p->pattern->ptr[out->rows_in_F[i] + 1]; ++iPtr) {
152                     rs[i]+=A_p->val[iPtr];
153                    }
154                  }
155                
156                #pragma omp for private(i, where_p,iPtr,A11,A12,A13,A21,A22,A23,A31,A32,A33,D,index) schedule(static)                #pragma omp for private(i, where_p,iPtr,A11,A12,A13,A21,A22,A23,A31,A32,A33,D,index) schedule(static)
157                for (i = 0; i < out->n_F; i++) {                for (i = 0; i < out->n_F; i++) {
158                  /* find main diagonal */                  /* find main diagonal */
# Line 145  Paso_Solver_AMG* Paso_Solver_getAMG(Paso Line 168  Paso_Solver_AMG* Paso_Solver_getAMG(Paso
168                  } else {                  } else {
169                      iPtr+=(index_t)(where_p-index);                      iPtr+=(index_t)(where_p-index);
170                      /* get inverse of A_FF block: */                      /* get inverse of A_FF block: */
171                      if (n_block==1) {                        if (ABS(rs[i])>0.) {
172                         if (ABS(A_p->val[iPtr])>0.) {                              out->inv_A_FF[i]=1./rs[i];
173                              out->inv_A_FF[i]=1./A_p->val[iPtr];                        } else {
                        } else {  
174                              Paso_setError(ZERO_DIVISION_ERROR, "Paso_Solver_getAMG: Break-down in AMG decomposition: non-regular main diagonal block.");                              Paso_setError(ZERO_DIVISION_ERROR, "Paso_Solver_getAMG: Break-down in AMG decomposition: non-regular main diagonal block.");
175                         }                        }
176                      } else if (n_block==2) {                  }
                        A11=A_p->val[iPtr*4];  
                        A21=A_p->val[iPtr*4+1];  
                        A12=A_p->val[iPtr*4+2];  
                        A22=A_p->val[iPtr*4+3];  
                        D = A11*A22-A12*A21;  
                        if (ABS(D) > 0 ){  
                             D=1./D;  
                             out->inv_A_FF[i*4]= A22*D;  
                             out->inv_A_FF[i*4+1]=-A21*D;  
                             out->inv_A_FF[i*4+2]=-A12*D;  
                             out->inv_A_FF[i*4+3]= A11*D;  
                        } else {  
                             Paso_setError(ZERO_DIVISION_ERROR, "Paso_Solver_getAMG:Break-down in AMG decomposition: non-regular main diagonal block.");  
                        }  
                     } else if (n_block==3) {  
                        A11=A_p->val[iPtr*9  ];  
                        A21=A_p->val[iPtr*9+1];  
                        A31=A_p->val[iPtr*9+2];  
                        A12=A_p->val[iPtr*9+3];  
                        A22=A_p->val[iPtr*9+4];  
                        A32=A_p->val[iPtr*9+5];  
                        A13=A_p->val[iPtr*9+6];  
                        A23=A_p->val[iPtr*9+7];  
                        A33=A_p->val[iPtr*9+8];  
                        D  =  A11*(A22*A33-A23*A32)+ A12*(A31*A23-A21*A33)+A13*(A21*A32-A31*A22);  
                        if (ABS(D) > 0 ){  
                             D=1./D;  
                             out->inv_A_FF[i*9  ]=(A22*A33-A23*A32)*D;  
                             out->inv_A_FF[i*9+1]=(A31*A23-A21*A33)*D;  
                             out->inv_A_FF[i*9+2]=(A21*A32-A31*A22)*D;  
                             out->inv_A_FF[i*9+3]=(A13*A32-A12*A33)*D;  
                             out->inv_A_FF[i*9+4]=(A11*A33-A31*A13)*D;  
                             out->inv_A_FF[i*9+5]=(A12*A31-A11*A32)*D;  
                             out->inv_A_FF[i*9+6]=(A12*A23-A13*A22)*D;  
                             out->inv_A_FF[i*9+7]=(A13*A21-A11*A23)*D;  
                             out->inv_A_FF[i*9+8]=(A11*A22-A12*A21)*D;  
                        } else {  
                             Paso_setError(ZERO_DIVISION_ERROR, "Paso_Solver_getAMG:Break-down in AMG decomposition: non-regular main diagonal block.");  
                        }  
                    }  
                 }  
177                }                }
178             } /* end parallel region */             } /* end parallel region */
179    
# Line 226  Paso_Solver_AMG* Paso_Solver_getAMG(Paso Line 207  Paso_Solver_AMG* Paso_Solver_getAMG(Paso
207                        if (Paso_noError()) {                        if (Paso_noError()) {
208                           /* get A_FC block: */                           /* get A_FC block: */
209                           out->A_FC=Paso_SparseMatrix_getSubmatrix(A_p,out->n_F,out->n_C,out->rows_in_F,out->mask_C);                           out->A_FC=Paso_SparseMatrix_getSubmatrix(A_p,out->n_F,out->n_C,out->rows_in_F,out->mask_C);
210                           /* get A_FF block: */                           /* get A_CC block: */
211                           if (Paso_noError()) {                           if (Paso_noError()) {
212                              schur=Paso_SparseMatrix_getSubmatrix(A_p,out->n_C,out->n_C,out->rows_in_C,out->mask_C);                              schur=Paso_SparseMatrix_getSubmatrix(A_p,out->n_C,out->n_C,out->rows_in_C,out->mask_C);
213                                
214                                /*find the pattern of the schur complement with fill in*/
215                                schur_withFillIn=Paso_SparseMatrix_alloc(A_p->type,Paso_Pattern_binop(PATTERN_FORMAT_DEFAULT, schur->pattern, Paso_Pattern_multiply(PATTERN_FORMAT_DEFAULT,out->A_CF->pattern,out->A_FC->pattern)),1,1);
216                                
217                                /* copy values over*/
218                                #pragma omp for private(i,iPtr,iPtr_s,j,j0) schedule(static)
219                                for (i = 0; i < schur_withFillIn->numRows; ++i) {
220                                  for (iPtr=schur_withFillIn->pattern->ptr[i];iPtr<schur_withFillIn->pattern->ptr[i + 1]; ++iPtr) {
221                                    j=schur_withFillIn->pattern->index[iPtr];
222                                    schur_withFillIn->val[iPtr]=0.;
223                                    for (iPtr_s=schur->pattern->ptr[i];iPtr_s<schur->pattern->ptr[i + 1]; ++iPtr_s){
224                                        j0=schur->pattern->index[iPtr_s];
225                                        if (j==j0) {
226                                          schur_withFillIn->val[iPtr]=schur->val[iPtr_s];
227                                          break;
228                                        }
229                                    }
230                                  }
231                                }
232                                
233                              /*  for (i = 0; i < schur_withFillIn->numRows; ++i) {
234                                  for (iPtr=schur_withFillIn->pattern->ptr[i];iPtr<schur_withFillIn->pattern->ptr[i + 1]; ++iPtr) {
235                                    j=schur_withFillIn->pattern->index[iPtr];
236                                    fprintf(stderr,"A_CC[%d,%d]=%.2f ",i,j,schur_withFillIn->val[iPtr]);
237                                  }
238                                  fprintf(stderr,"\n");
239                                }*/
240                              time0=Paso_timer()-time0;                              time0=Paso_timer()-time0;
241                              if (Paso_noError()) {                              if (Paso_noError()) {
242                                  time1=Paso_timer();                                  time1=Paso_timer();
243                                  /* update A_CC block to get Schur complement and then apply AMG to it */                                  /* update A_CC block to get Schur complement and then apply AMG to it */
244                                  Paso_Solver_updateIncompleteSchurComplement(schur,out->A_CF,out->inv_A_FF,out->A_FF_pivot,out->A_FC);                                  Paso_Solver_updateIncompleteSchurComplement(schur_withFillIn,out->A_CF,out->inv_A_FF,out->A_FF_pivot,out->A_FC);
245                                  time1=Paso_timer()-time1;                                  time1=Paso_timer()-time1;
246                                  out->AMG_of_Schur=Paso_Solver_getAMG(schur,verbose);                                  out->AMG_of_Schur=Paso_Solver_getAMG(schur_withFillIn,verbose);
247                                    
248                                  Paso_SparseMatrix_free(schur);                                  Paso_SparseMatrix_free(schur);
249                                    Paso_SparseMatrix_free(schur_withFillIn);
250                              }                              }
251                              /* allocate work arrays for AMG application */                              /* allocate work arrays for AMG application */
252                              if (Paso_noError()) {                              if (Paso_noError()) {
# Line 274  Paso_Solver_AMG* Paso_Solver_getAMG(Paso Line 284  Paso_Solver_AMG* Paso_Solver_getAMG(Paso
284    }    }
285    TMPMEMFREE(mis_marker);    TMPMEMFREE(mis_marker);
286    TMPMEMFREE(counter);    TMPMEMFREE(counter);
287      TMPMEMFREE(rs);
288    if (Paso_noError()) {    if (Paso_noError()) {
289        if (verbose) {        if (verbose) {
290           printf("AMG: %d unknowns eliminated. %d left.\n",out->n_F,n-out->n_F);           printf("AMG: %d unknowns eliminated. %d left.\n",out->n_F,n-out->n_F);
# Line 317  Paso_Solver_AMG* Paso_Solver_getAMG(Paso Line 328  Paso_Solver_AMG* Paso_Solver_getAMG(Paso
328  void Paso_Solver_solveAMG(Paso_Solver_AMG * amg, double * x, double * b) {  void Paso_Solver_solveAMG(Paso_Solver_AMG * amg, double * x, double * b) {
329       dim_t i,k;       dim_t i,k;
330       dim_t n_block=amg->n_block;       dim_t n_block=amg->n_block;
331        
332       if (amg->n_C==0) {       if (amg->n_C==0) {
333          /* x=invA_FF*b  */          /* x=invA_FF*b  */
334          Paso_Solver_applyBlockDiagonalMatrix(n_block,amg->n_F,amg->inv_A_FF,amg->A_FF_pivot,x,b);          Paso_Solver_applyBlockDiagonalMatrix(n_block,amg->n_F,amg->inv_A_FF,amg->A_FF_pivot,x,b);
335       } else {       } else {
336            /* presmoothing on (Shure, x, b, r) */
337          /* b->[b_F,b_C]     */          /* b->[b_F,b_C]     */
338          if (n_block==1) {          if (n_block==1) {
339             #pragma omp parallel for private(i) schedule(static)             #pragma omp parallel for private(i) schedule(static)

Legend:
Removed from v.1851  
changed lines
  Added in v.1887

  ViewVC Help
Powered by ViewVC 1.1.26