/[escript]/branches/doubleplusgood/dudley/src/Assemble_PDE_Single2_1D.cpp
ViewVC logotype

Diff of /branches/doubleplusgood/dudley/src/Assemble_PDE_Single2_1D.cpp

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 2548 by jfenwick, Mon Jul 20 06:20:06 2009 UTC revision 2748 by gross, Tue Nov 17 07:32:59 2009 UTC
# Line 51  void  Finley_Assemble_PDE_Single2_1D(Ass Line 51  void  Finley_Assemble_PDE_Single2_1D(Ass
51    
52      #define DIM 1      #define DIM 1
53      index_t color;      index_t color;
54      dim_t e;      dim_t e, isub;
55      __const double *A_p, *B_p, *C_p, *D_p, *X_p, *Y_p;      __const double *A_p, *B_p, *C_p, *D_p, *X_p, *Y_p, *A_q, *B_q, *C_q, *D_q, *X_q, *Y_q;
56      double *EM_S, *EM_F, *Vol, *DSDX;      double *EM_S, *EM_F, *Vol, *DSDX;
57      index_t *row_index;      index_t *row_index;
58      register dim_t q, s,r;      register dim_t q, s,r;
# Line 66  void  Finley_Assemble_PDE_Single2_1D(Ass Line 66  void  Finley_Assemble_PDE_Single2_1D(Ass
66      bool_t extendedX=isExpanded(X);      bool_t extendedX=isExpanded(X);
67      bool_t extendedY=isExpanded(Y);      bool_t extendedY=isExpanded(Y);
68      double *F_p=(requireWrite(F), getSampleDataRW(F,0));    /* use comma, to get around the mixed code and declarations thing */      double *F_p=(requireWrite(F), getSampleDataRW(F,0));    /* use comma, to get around the mixed code and declarations thing */
69      double *S=p.row_jac->ReferenceElement->S;      double *S=p.row_jac->BasisFunctions->S;
70      dim_t len_EM_S=p.row_NN*p.col_NN;      dim_t len_EM_S=p.row_numShapesTotal*p.col_numShapesTotal;
71      dim_t len_EM_F=p.row_NN;      dim_t len_EM_F=p.row_numShapesTotal;
72    
73      void* ABuff=allocSampleBuffer(A);      void* ABuff=allocSampleBuffer(A);
74      void* BBuff=allocSampleBuffer(B);      void* BBuff=allocSampleBuffer(B);
# Line 76  void  Finley_Assemble_PDE_Single2_1D(Ass Line 76  void  Finley_Assemble_PDE_Single2_1D(Ass
76      void* DBuff=allocSampleBuffer(D);      void* DBuff=allocSampleBuffer(D);
77      void* XBuff=allocSampleBuffer(X);      void* XBuff=allocSampleBuffer(X);
78      void* YBuff=allocSampleBuffer(Y);      void* YBuff=allocSampleBuffer(Y);
79      #pragma omp parallel private(color, EM_S, EM_F, Vol, DSDX, A_p, B_p, C_p, D_p, X_p, Y_p, row_index, q, s,r,rtmp,add_EM_F, add_EM_S)      #pragma omp parallel private(color, EM_S, EM_F, Vol, DSDX, A_p, B_p, C_p, D_p, X_p, Y_p, A_q, B_q, C_q, D_q, X_q, Y_q, row_index, q, s,r,rtmp,add_EM_F, add_EM_S, isub)
80      {      {
81         EM_S=THREAD_MEMALLOC(len_EM_S,double);         EM_S=THREAD_MEMALLOC(len_EM_S,double);
82         EM_F=THREAD_MEMALLOC(len_EM_F,double);         EM_F=THREAD_MEMALLOC(len_EM_F,double);
83         row_index=THREAD_MEMALLOC(p.row_NN,index_t);         row_index=THREAD_MEMALLOC(p.row_numShapesTotal,index_t);
84    
85    
86         if (!Finley_checkPtr(EM_S) && !Finley_checkPtr(EM_F) && !Finley_checkPtr(row_index) ) {         if (!Finley_checkPtr(EM_S) && !Finley_checkPtr(EM_F) && !Finley_checkPtr(row_index) ) {
# Line 90  void  Finley_Assemble_PDE_Single2_1D(Ass Line 90  void  Finley_Assemble_PDE_Single2_1D(Ass
90               #pragma omp for private(e) schedule(static)               #pragma omp for private(e) schedule(static)
91               for(e=0;e<elements->numElements;e++){               for(e=0;e<elements->numElements;e++){
92                  if (elements->Color[e]==color) {                  if (elements->Color[e]==color) {
93                     Vol=&(p.row_jac->volume[INDEX2(0,e,p.numQuad)]);  
94                     DSDX=&(p.row_jac->DSDX[INDEX4(0,0,0,e,p.row_NN,DIM,p.numQuad)]);                    A_p=getSampleDataRO(A,e,ABuff);
95                     for (q=0;q<len_EM_S;++q) EM_S[q]=0;                    C_p=getSampleDataRO(C,e,CBuff);
96                     for (q=0;q<len_EM_F;++q) EM_F[q]=0;                    B_p=getSampleDataRO(B,e,BBuff);
97                     add_EM_F=FALSE;                    D_p=getSampleDataRO(D,e,DBuff);
98                     add_EM_S=FALSE;                    X_p=getSampleDataRO(X,e,XBuff);
99                     /**************************************************************/                    Y_p=getSampleDataRO(Y,e,YBuff);
100                     /*   process A: */  
101                     /**************************************************************/                    for (isub=0; isub<p.numSub; isub++) {
102                     A_p=getSampleDataRO(A,e,ABuff);                        Vol=&(p.row_jac->volume[INDEX3(0,isub,e, p.numQuadSub,p.numSub)]);
103                     if (NULL!=A_p) {                        DSDX=&(p.row_jac->DSDX[INDEX5(0,0,0,isub,e, p.row_numShapesTotal,DIM,p.numQuadSub,p.numSub)]);
104                        add_EM_S=TRUE;                        for (q=0;q<len_EM_S;++q) EM_S[q]=0;
105                        if (extendedA) {                        for (q=0;q<len_EM_F;++q) EM_F[q]=0;
106                           for (s=0;s<p.row_NS;s++) {                        add_EM_F=FALSE;
107                             for (r=0;r<p.col_NS;r++) {                        add_EM_S=FALSE;
108                                rtmp=0;                        /**************************************************************/
109                                for (q=0;q<p.numQuad;q++) {                        /*   process A: */
110                                   rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*A_p[INDEX3(0,0,q,DIM,DIM)]*DSDX[INDEX3(r,0,q,p.row_NN,DIM)];                        /**************************************************************/
111                               }                        if (NULL!=A_p) {
112                               EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp;                           add_EM_S=TRUE;
113                             }                           if (extendedA) {
114                           }                  A_q=&(A_p[INDEX4(0,0,0,isub, DIM,DIM,p.numQuadSub)]);
115                        } else {                              for (s=0;s<p.row_numShapes;s++) {
116                           for (s=0;s<p.row_NS;s++) {                                for (r=0;r<p.col_numShapes;r++) {
117                             for (r=0;r<p.col_NS;r++) {                                   rtmp=0;
118                                 rtmp=0;                                   for (q=0;q<p.numQuadSub;q++) {
119                                 for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*DSDX[INDEX3(r,0,q,p.row_NN,DIM)];                                      rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_numShapesTotal,DIM)]*A_q[INDEX3(0,0,q,DIM,DIM)]*DSDX[INDEX3(r,0,q,p.row_numShapesTotal,DIM)];
120                                 EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp*A_p[INDEX2(0,0,DIM)];                                  }
121                             }                                  EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp;
122                           }                                }
123                         }                              }
124                     }                           } else {
125                     /**************************************************************/                              for (s=0;s<p.row_numShapes;s++) {
126                     /*   process B: */                                for (r=0;r<p.col_numShapes;r++) {
127                     /**************************************************************/                                    rtmp=0;
128                     B_p=getSampleDataRO(B,e,BBuff);                                    for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_numShapesTotal,DIM)]*DSDX[INDEX3(r,0,q,p.row_numShapesTotal,DIM)];
129                     if (NULL!=B_p) {                                    EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp*A_p[INDEX2(0,0,DIM)];
130                        add_EM_S=TRUE;                                }
131                        if (extendedB) {                              }
132                           for (s=0;s<p.row_NS;s++) {                            }
133                             for (r=0;r<p.col_NS;r++) {                        }
134                               rtmp=0;                        /**************************************************************/
135                               for (q=0;q<p.numQuad;q++) {                        /*   process B: */
136                                  rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*B_p[INDEX2(0,q,DIM)]*S[INDEX2(r,q,p.row_NS)];                        /**************************************************************/
137                               }                        if (NULL!=B_p) {
138                               EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp;                           add_EM_S=TRUE;
139                             }                           if (extendedB) {
140                           }                  B_q=&(B_p[INDEX3(0,0,isub, DIM, p.numQuadSub)]);
141                        } else {                              for (s=0;s<p.row_numShapes;s++) {
142                           for (s=0;s<p.row_NS;s++) {                                for (r=0;r<p.col_numShapes;r++) {
143                             for (r=0;r<p.col_NS;r++) {                                  rtmp=0;
144                                 rtmp=0;                                  for (q=0;q<p.numQuadSub;q++) {
145                                 for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*S[INDEX2(r,q,p.row_NS)];                                     rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_numShapesTotal,DIM)]*B_q[INDEX2(0,q,DIM)]*S[INDEX2(r,q,p.row_numShapes)];
146                                 EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp*B_p[0];                                  }
147                             }                                  EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp;
148                                  }
149                                }
150                             } else {
151                                for (s=0;s<p.row_numShapes;s++) {
152                                  for (r=0;r<p.col_numShapes;r++) {
153                                      rtmp=0;
154                                      for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_numShapesTotal,DIM)]*S[INDEX2(r,q,p.row_numShapes)];
155                                      EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp*B_p[0];
156                                  }
157                                }
158                           }                           }
159                        }                        }
160                     }                        /**************************************************************/
161                     /**************************************************************/                        /*   process C: */
162                     /*   process C: */                        /**************************************************************/
163                     /**************************************************************/                        if (NULL!=C_p) {
164                     C_p=getSampleDataRO(C,e,CBuff);                           add_EM_S=TRUE;
165                     if (NULL!=C_p) {                          if (extendedC) {
166                        add_EM_S=TRUE;                  C_q=&(C_p[INDEX3(0,0,isub, DIM, p.numQuadSub)]);
167                       if (extendedC) {                              for (s=0;s<p.row_numShapes;s++) {
168                           for (s=0;s<p.row_NS;s++) {                                for (r=0;r<p.col_numShapes;r++) {
169                             for (r=0;r<p.col_NS;r++) {                                  rtmp=0;
170                                    for (q=0;q<p.numQuadSub;q++) {
171                                       rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)]*C_q[INDEX2(0,q,DIM)]*DSDX[INDEX3(r,0,q,p.row_numShapesTotal,DIM)];
172                                    }
173                                    EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp;
174                                  }
175                                }
176                            } else {
177                                for (s=0;s<p.row_numShapes;s++) {
178                                  for (r=0;r<p.col_numShapes;r++) {
179                                     rtmp=0;
180                                     for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)]*DSDX[INDEX3(r,0,q,p.row_numShapesTotal,DIM)];
181                                     EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp*C_p[0];
182                                  }
183                                }
184                            }
185                          }
186                          /************************************************************* */
187                          /* process D */
188                          /**************************************************************/
189                          if (NULL!=D_p) {
190                            add_EM_S=TRUE;
191                            if (extendedD) {
192                    D_q=&(D_p[INDEX2(0,isub, p.numQuadSub)]);
193                                for (s=0;s<p.row_numShapes;s++) {
194                                  for (r=0;r<p.col_numShapes;r++) {
195                                     rtmp=0;
196                                     for (q=0;q<p.numQuadSub;q++) {
197                                        rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)]*D_q[q]*S[INDEX2(r,q,p.row_numShapes)];
198                                    }
199                                    EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp;
200                                  }
201                                }
202                            } else {
203                                for (s=0;s<p.row_numShapes;s++) {
204                                  for (r=0;r<p.col_numShapes;r++) {
205                                      rtmp=0;
206                                      for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)]*S[INDEX2(r,q,p.row_numShapes)];
207                                      EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp*D_p[0];
208                                  }
209                                }
210                            }
211                          }
212                          /**************************************************************/
213                          /*   process X: */
214                          /**************************************************************/
215                          if (NULL!=X_p) {
216                            add_EM_F=TRUE;
217                            if (extendedX) {
218                       X_q=&(X_p[INDEX3(0,0,isub, DIM,p.numQuadSub)]);
219                               for (s=0;s<p.row_numShapes;s++) {
220                               rtmp=0;                               rtmp=0;
221                               for (q=0;q<p.numQuad;q++) {                               for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_numShapesTotal,DIM)]*X_q[INDEX2(0,q,DIM)];
222                                  rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*C_p[INDEX2(0,q,DIM)]*DSDX[INDEX3(r,0,q,p.row_NN,DIM)];                               EM_F[INDEX2(0,s,p.numEqu)]+=rtmp;
                              }  
                              EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp;  
223                             }                             }
224                           }                          } else {
225                       } else {                             for (s=0;s<p.row_numShapes;s++) {
226                           for (s=0;s<p.row_NS;s++) {                               rtmp=0;
227                             for (r=0;r<p.col_NS;r++) {                               for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q, p.row_numShapesTotal,DIM)];
228                                rtmp=0;                               EM_F[INDEX2(0,s,p.numEqu)]+=rtmp*X_p[0];
                               for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*DSDX[INDEX3(r,0,q,p.row_NN,DIM)];  
                               EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp*C_p[0];  
229                             }                             }
230                           }                          }
231                       }                       }
232                     }                       /**************************************************************/
233                     /************************************************************* */                       /*   process Y: */
234                     /* process D */                       /**************************************************************/
235                     /**************************************************************/                        if (NULL!=Y_p) {
236                     D_p=getSampleDataRO(D,e,DBuff);                          add_EM_F=TRUE;
237                     if (NULL!=D_p) {                          if (extendedY) {
238                       add_EM_S=TRUE;                 Y_q=&(Y_p[INDEX2(0,isub, p.numQuadSub)]);
239                       if (extendedD) {                             for (s=0;s<p.row_numShapes;s++) {
                          for (s=0;s<p.row_NS;s++) {  
                            for (r=0;r<p.col_NS;r++) {  
240                                rtmp=0;                                rtmp=0;
241                                for (q=0;q<p.numQuad;q++) {                                for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)]*Y_q[q];
242                                   rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*D_p[q]*S[INDEX2(r,q,p.row_NS)];                                EM_F[INDEX2(0,s,p.numEqu)]+=rtmp;
                              }  
                              EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp;  
243                             }                             }
244                           }                           } else {
245                       } else {                             for (s=0;s<p.row_numShapes;s++) {
                          for (s=0;s<p.row_NS;s++) {  
                            for (r=0;r<p.col_NS;r++) {  
246                                 rtmp=0;                                 rtmp=0;
247                                 for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*S[INDEX2(r,q,p.row_NS)];                                 for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)];
248                                 EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp*D_p[0];                                 EM_F[INDEX2(0,s,p.numEqu)]+=rtmp*Y_p[0];
249                             }                             }
250                           }                           }
251                       }                         }
252                     }                         /***********************************************************************************************/
253                     /**************************************************************/                         /* add the element matrices onto the matrix and right hand side                                */
254                     /*   process X: */                         /***********************************************************************************************/
255                     /**************************************************************/                         for (q=0;q<p.row_numShapesTotal;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[INDEX2(q,isub,p.row_numShapesTotal)],e,p.NN)]];
256                     X_p=getSampleDataRO(X,e,XBuff);                
257                     if (NULL!=X_p) {                         if (add_EM_F) Finley_Util_AddScatter(p.row_numShapesTotal,row_index,p.numEqu,EM_F,F_p, p.row_DOF_UpperBound);
258                       add_EM_F=TRUE;                         if (add_EM_S) Finley_Assemble_addToSystemMatrix(Mat,p.row_numShapesTotal,row_index,p.numEqu,p.col_numShapesTotal,row_index,p.numComp,EM_S);
259                       if (extendedX) {                    } /* end of isub */
                         for (s=0;s<p.row_NS;s++) {  
                           rtmp=0;  
                           for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*X_p[INDEX2(0,q,DIM)];  
                           EM_F[INDEX2(0,s,p.numEqu)]+=rtmp;  
                         }  
                      } else {  
                         for (s=0;s<p.row_NS;s++) {  
                           rtmp=0;  
                           for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)];  
                           EM_F[INDEX2(0,s,p.numEqu)]+=rtmp*X_p[0];  
                         }  
                      }  
                   }  
                   /**************************************************************/  
                   /*   process Y: */  
                   /**************************************************************/  
                    Y_p=getSampleDataRO(Y,e,YBuff);  
                    if (NULL!=Y_p) {  
                      add_EM_F=TRUE;  
                      if (extendedY) {  
                         for (s=0;s<p.row_NS;s++) {  
                            rtmp=0;  
                            for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*Y_p[q];  
                            EM_F[INDEX2(0,s,p.numEqu)]+=rtmp;  
                         }  
                       } else {  
                         for (s=0;s<p.row_NS;s++) {  
                             rtmp=0;  
                             for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)];  
                             EM_F[INDEX2(0,s,p.numEqu)]+=rtmp*Y_p[0];  
                         }  
                       }  
                     }  
                     /***********************************************************************************************/  
                     /* add the element matrices onto the matrix and right hand side                                */  
                     /***********************************************************************************************/  
                     for (q=0;q<p.row_NN;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[q],e,p.NN)]];  
                     if (add_EM_F) Finley_Util_AddScatter(p.row_NN,row_index,p.numEqu,EM_F,F_p, p.row_DOF_UpperBound);  
                     if (add_EM_S) Finley_Assemble_addToSystemMatrix(Mat,p.row_NN,row_index,p.numEqu,p.col_NN,row_index,p.numComp,EM_S);  
260        
261                  } /* end color check */                  } /* end color check */
262               } /* end element loop */               } /* end element loop */

Legend:
Removed from v.2548  
changed lines
  Added in v.2748

  ViewVC Help
Powered by ViewVC 1.1.26