/[escript]/branches/doubleplusgood/dudley/src/Assemble_PDE_Single2_1D.cpp
ViewVC logotype

Diff of /branches/doubleplusgood/dudley/src/Assemble_PDE_Single2_1D.cpp

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 853 by gross, Wed Sep 20 05:56:36 2006 UTC revision 2770 by jfenwick, Wed Nov 25 01:24:51 2009 UTC
# Line 1  Line 1 
1  /*  
2   ************************************************************  /*******************************************************
3   *          Copyright 2006 by ACcESS MNRF                   *  *
4   *                                                          *  * Copyright (c) 2003-2009 by University of Queensland
5   *              http://www.access.edu.au                    *  * Earth Systems Science Computational Center (ESSCC)
6   *       Primary Business: Queensland, Australia            *  * http://www.uq.edu.au/esscc
7   *  Licensed under the Open Software License version 1.0    *  *
8   *     http://www.opensource.org/licenses/osl-3.0.php       *  * Primary Business: Queensland, Australia
9   *                                                          *  * Licensed under the Open Software License version 3.0
10   ************************************************************  * http://www.opensource.org/licenses/osl-3.0.php
11  */  *
12    *******************************************************/
13    
14    
15  /**************************************************************/  /**************************************************************/
16    
# Line 33  Line 35 
35    
36  /**************************************************************/  /**************************************************************/
37    
 /*  Author: gross@access.edu.au */  
 /*  Version: $Id:$ */  
   
 /**************************************************************/  
   
38    
39  #include "Assemble.h"  #include "Assemble.h"
40  #include "Util.h"  #include "Util.h"
# Line 54  void  Finley_Assemble_PDE_Single2_1D(Ass Line 51  void  Finley_Assemble_PDE_Single2_1D(Ass
51    
52      #define DIM 1      #define DIM 1
53      index_t color;      index_t color;
54      dim_t e;      dim_t e, isub;
55      double *EM_S, *EM_F, *Vol, *DSDX, *A_p, *B_p, *C_p, *D_p, *X_p, *Y_p;      __const double *A_p, *B_p, *C_p, *D_p, *X_p, *Y_p, *A_q, *B_q, *C_q, *D_q, *X_q, *Y_q;
56        double *EM_S, *EM_F, *Vol, *DSDX;
57      index_t *row_index;      index_t *row_index;
58      register dim_t q, s,r;      register dim_t q, s,r;
59      register double rtmp;      register double rtmp;
# Line 67  void  Finley_Assemble_PDE_Single2_1D(Ass Line 65  void  Finley_Assemble_PDE_Single2_1D(Ass
65      bool_t extendedD=isExpanded(D);      bool_t extendedD=isExpanded(D);
66      bool_t extendedX=isExpanded(X);      bool_t extendedX=isExpanded(X);
67      bool_t extendedY=isExpanded(Y);      bool_t extendedY=isExpanded(Y);
68      double *F_p=getSampleData(F,0);      double *F_p=(requireWrite(F), getSampleDataRW(F,0));    /* use comma, to get around the mixed code and declarations thing */
69      double *S=p.row_jac->ReferenceElement->S;      double *S=p.row_jac->BasisFunctions->S;
70      dim_t len_EM_S=p.row_NN*p.col_NN;      dim_t len_EM_S=p.row_numShapesTotal*p.col_numShapesTotal;
71      dim_t len_EM_F=p.row_NN;      dim_t len_EM_F=p.row_numShapesTotal;
72    
73        #pragma omp parallel private(color, EM_S, EM_F, Vol, DSDX, A_p, B_p, C_p, D_p, X_p, Y_p, A_q, B_q, C_q, D_q, X_q, Y_q, row_index, q, s,r,rtmp,add_EM_F, add_EM_S, isub)
     #pragma omp parallel private(color, EM_S, EM_F, Vol, DSDX, A_p, B_p, C_p, D_p, X_p, Y_p, row_index, q, s,r,rtmp,add_EM_F, add_EM_S)  
74      {      {
75         EM_S=THREAD_MEMALLOC(len_EM_S,double);         EM_S=THREAD_MEMALLOC(len_EM_S,double);
76         EM_F=THREAD_MEMALLOC(len_EM_F,double);         EM_F=THREAD_MEMALLOC(len_EM_F,double);
77         row_index=THREAD_MEMALLOC(p.row_NN,index_t);         row_index=THREAD_MEMALLOC(p.row_numShapesTotal,index_t);
78    
79    
80         if (!Finley_checkPtr(EM_S) && !Finley_checkPtr(EM_F) && !Finley_checkPtr(row_index) ) {         if (!Finley_checkPtr(EM_S) && !Finley_checkPtr(EM_F) && !Finley_checkPtr(row_index) ) {
81    
           #ifndef PASO_MPI  
82            for (color=elements->minColor;color<=elements->maxColor;color++) {            for (color=elements->minColor;color<=elements->maxColor;color++) {
83               /*  open loop over all elements: */               /*  open loop over all elements: */
84               #pragma omp for private(e) schedule(static)               #pragma omp for private(e) schedule(static)
85               for(e=0;e<elements->numElements;e++){               for(e=0;e<elements->numElements;e++){
86                  if (elements->Color[e]==color) {                  if (elements->Color[e]==color) {
87            #else  
88            {                    A_p=getSampleDataRO(A,e);
89               for(e=0;e<elements->numElements;e++) {                    C_p=getSampleDataRO(C,e);
90                  {                    B_p=getSampleDataRO(B,e);
91            #endif                    D_p=getSampleDataRO(D,e);
92                     Vol=&(p.row_jac->volume[INDEX2(0,e,p.numQuad)]);                    X_p=getSampleDataRO(X,e);
93                     DSDX=&(p.row_jac->DSDX[INDEX4(0,0,0,e,p.row_NN,DIM,p.numQuad)]);                    Y_p=getSampleDataRO(Y,e);
94                     for (q=0;q<len_EM_S;++q) EM_S[q]=0;  
95                     for (q=0;q<len_EM_F;++q) EM_F[q]=0;                    for (isub=0; isub<p.numSub; isub++) {
96                     add_EM_F=FALSE;                        Vol=&(p.row_jac->volume[INDEX3(0,isub,e, p.numQuadSub,p.numSub)]);
97                     add_EM_S=FALSE;                        DSDX=&(p.row_jac->DSDX[INDEX5(0,0,0,isub,e, p.row_numShapesTotal,DIM,p.numQuadSub,p.numSub)]);
98                     /**************************************************************/                        for (q=0;q<len_EM_S;++q) EM_S[q]=0;
99                     /*   process A: */                        for (q=0;q<len_EM_F;++q) EM_F[q]=0;
100                     /**************************************************************/                        add_EM_F=FALSE;
101                     A_p=getSampleData(A,e);                        add_EM_S=FALSE;
102                     if (NULL!=A_p) {                        /**************************************************************/
103                        add_EM_S=TRUE;                        /*   process A: */
104                        if (extendedA) {                        /**************************************************************/
105                           for (s=0;s<p.row_NS;s++) {                        if (NULL!=A_p) {
106                             for (r=0;r<p.col_NS;r++) {                           add_EM_S=TRUE;
107                                rtmp=0;                           if (extendedA) {
108                                for (q=0;q<p.numQuad;q++) {                  A_q=&(A_p[INDEX4(0,0,0,isub, DIM,DIM,p.numQuadSub)]);
109                                   rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*A_p[INDEX3(0,0,q,DIM,DIM)]*DSDX[INDEX3(r,0,q,p.row_NN,DIM)];                              for (s=0;s<p.row_numShapes;s++) {
110                               }                                for (r=0;r<p.col_numShapes;r++) {
111                               EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp;                                   rtmp=0;
112                             }                                   for (q=0;q<p.numQuadSub;q++) {
113                           }                                      rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_numShapesTotal,DIM)]*A_q[INDEX3(0,0,q,DIM,DIM)]*DSDX[INDEX3(r,0,q,p.row_numShapesTotal,DIM)];
114                        } else {                                  }
115                           for (s=0;s<p.row_NS;s++) {                                  EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp;
116                             for (r=0;r<p.col_NS;r++) {                                }
117                                 rtmp=0;                              }
118                                 for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*DSDX[INDEX3(r,0,q,p.row_NN,DIM)];                           } else {
119                                 EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp*A_p[INDEX2(0,0,DIM)];                              for (s=0;s<p.row_numShapes;s++) {
120                             }                                for (r=0;r<p.col_numShapes;r++) {
121                           }                                    rtmp=0;
122                         }                                    for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_numShapesTotal,DIM)]*DSDX[INDEX3(r,0,q,p.row_numShapesTotal,DIM)];
123                     }                                    EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp*A_p[INDEX2(0,0,DIM)];
124                     /**************************************************************/                                }
125                     /*   process B: */                              }
126                     /**************************************************************/                            }
127                     B_p=getSampleData(B,e);                        }
128                     if (NULL!=B_p) {                        /**************************************************************/
129                        add_EM_S=TRUE;                        /*   process B: */
130                        if (extendedB) {                        /**************************************************************/
131                           for (s=0;s<p.row_NS;s++) {                        if (NULL!=B_p) {
132                             for (r=0;r<p.col_NS;r++) {                           add_EM_S=TRUE;
133                               rtmp=0;                           if (extendedB) {
134                               for (q=0;q<p.numQuad;q++) {                  B_q=&(B_p[INDEX3(0,0,isub, DIM, p.numQuadSub)]);
135                                  rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*B_p[INDEX2(0,q,DIM)]*S[INDEX2(r,q,p.row_NS)];                              for (s=0;s<p.row_numShapes;s++) {
136                               }                                for (r=0;r<p.col_numShapes;r++) {
137                               EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp;                                  rtmp=0;
138                             }                                  for (q=0;q<p.numQuadSub;q++) {
139                           }                                     rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_numShapesTotal,DIM)]*B_q[INDEX2(0,q,DIM)]*S[INDEX2(r,q,p.row_numShapes)];
140                        } else {                                  }
141                           for (s=0;s<p.row_NS;s++) {                                  EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp;
142                             for (r=0;r<p.col_NS;r++) {                                }
143                                 rtmp=0;                              }
144                                 for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*S[INDEX2(r,q,p.row_NS)];                           } else {
145                                 EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp*B_p[0];                              for (s=0;s<p.row_numShapes;s++) {
146                             }                                for (r=0;r<p.col_numShapes;r++) {
147                                      rtmp=0;
148                                      for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_numShapesTotal,DIM)]*S[INDEX2(r,q,p.row_numShapes)];
149                                      EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp*B_p[0];
150                                  }
151                                }
152                           }                           }
153                        }                        }
154                     }                        /**************************************************************/
155                     /**************************************************************/                        /*   process C: */
156                     /*   process C: */                        /**************************************************************/
157                     /**************************************************************/                        if (NULL!=C_p) {
158                     C_p=getSampleData(C,e);                           add_EM_S=TRUE;
159                     if (NULL!=C_p) {                          if (extendedC) {
160                        add_EM_S=TRUE;                  C_q=&(C_p[INDEX3(0,0,isub, DIM, p.numQuadSub)]);
161                       if (extendedC) {                              for (s=0;s<p.row_numShapes;s++) {
162                           for (s=0;s<p.row_NS;s++) {                                for (r=0;r<p.col_numShapes;r++) {
163                             for (r=0;r<p.col_NS;r++) {                                  rtmp=0;
164                                    for (q=0;q<p.numQuadSub;q++) {
165                                       rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)]*C_q[INDEX2(0,q,DIM)]*DSDX[INDEX3(r,0,q,p.row_numShapesTotal,DIM)];
166                                    }
167                                    EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp;
168                                  }
169                                }
170                            } else {
171                                for (s=0;s<p.row_numShapes;s++) {
172                                  for (r=0;r<p.col_numShapes;r++) {
173                                     rtmp=0;
174                                     for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)]*DSDX[INDEX3(r,0,q,p.row_numShapesTotal,DIM)];
175                                     EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp*C_p[0];
176                                  }
177                                }
178                            }
179                          }
180                          /************************************************************* */
181                          /* process D */
182                          /**************************************************************/
183                          if (NULL!=D_p) {
184                            add_EM_S=TRUE;
185                            if (extendedD) {
186                    D_q=&(D_p[INDEX2(0,isub, p.numQuadSub)]);
187                                for (s=0;s<p.row_numShapes;s++) {
188                                  for (r=0;r<p.col_numShapes;r++) {
189                                     rtmp=0;
190                                     for (q=0;q<p.numQuadSub;q++) {
191                                        rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)]*D_q[q]*S[INDEX2(r,q,p.row_numShapes)];
192                                    }
193                                    EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp;
194                                  }
195                                }
196                            } else {
197                                for (s=0;s<p.row_numShapes;s++) {
198                                  for (r=0;r<p.col_numShapes;r++) {
199                                      rtmp=0;
200                                      for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)]*S[INDEX2(r,q,p.row_numShapes)];
201                                      EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp*D_p[0];
202                                  }
203                                }
204                            }
205                          }
206                          /**************************************************************/
207                          /*   process X: */
208                          /**************************************************************/
209                          if (NULL!=X_p) {
210                            add_EM_F=TRUE;
211                            if (extendedX) {
212                       X_q=&(X_p[INDEX3(0,0,isub, DIM,p.numQuadSub)]);
213                               for (s=0;s<p.row_numShapes;s++) {
214                               rtmp=0;                               rtmp=0;
215                               for (q=0;q<p.numQuad;q++) {                               for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_numShapesTotal,DIM)]*X_q[INDEX2(0,q,DIM)];
216                                  rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*C_p[INDEX2(0,q,DIM)]*DSDX[INDEX3(r,0,q,p.row_NN,DIM)];                               EM_F[INDEX2(0,s,p.numEqu)]+=rtmp;
                              }  
                              EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp;  
217                             }                             }
218                           }                          } else {
219                       } else {                             for (s=0;s<p.row_numShapes;s++) {
220                           for (s=0;s<p.row_NS;s++) {                               rtmp=0;
221                             for (r=0;r<p.col_NS;r++) {                               for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q, p.row_numShapesTotal,DIM)];
222                                rtmp=0;                               EM_F[INDEX2(0,s,p.numEqu)]+=rtmp*X_p[0];
                               for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*DSDX[INDEX3(r,0,q,p.row_NN,DIM)];  
                               EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp*C_p[0];  
223                             }                             }
224                           }                          }
225                       }                       }
226                     }                       /**************************************************************/
227                     /************************************************************* */                       /*   process Y: */
228                     /* process D */                       /**************************************************************/
229                     /**************************************************************/                        if (NULL!=Y_p) {
230                     D_p=getSampleData(D,e);                          add_EM_F=TRUE;
231                     if (NULL!=D_p) {                          if (extendedY) {
232                       add_EM_S=TRUE;                 Y_q=&(Y_p[INDEX2(0,isub, p.numQuadSub)]);
233                       if (extendedD) {                             for (s=0;s<p.row_numShapes;s++) {
                          for (s=0;s<p.row_NS;s++) {  
                            for (r=0;r<p.col_NS;r++) {  
234                                rtmp=0;                                rtmp=0;
235                                for (q=0;q<p.numQuad;q++) {                                for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)]*Y_q[q];
236                                   rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*D_p[q]*S[INDEX2(r,q,p.row_NS)];                                EM_F[INDEX2(0,s,p.numEqu)]+=rtmp;
                              }  
                              EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp;  
237                             }                             }
238                           }                           } else {
239                       } else {                             for (s=0;s<p.row_numShapes;s++) {
                          for (s=0;s<p.row_NS;s++) {  
                            for (r=0;r<p.col_NS;r++) {  
240                                 rtmp=0;                                 rtmp=0;
241                                 for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*S[INDEX2(r,q,p.row_NS)];                                 for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)];
242                                 EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp*D_p[0];                                 EM_F[INDEX2(0,s,p.numEqu)]+=rtmp*Y_p[0];
243                             }                             }
244                           }                           }
245                       }                         }
246                     }                         /***********************************************************************************************/
247                     /**************************************************************/                         /* add the element matrices onto the matrix and right hand side                                */
248                     /*   process X: */                         /***********************************************************************************************/
249                     /**************************************************************/                         for (q=0;q<p.row_numShapesTotal;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[INDEX2(q,isub,p.row_numShapesTotal)],e,p.NN)]];
250                     X_p=getSampleData(X,e);                
251                     if (NULL!=X_p) {                         if (add_EM_F) Finley_Util_AddScatter(p.row_numShapesTotal,row_index,p.numEqu,EM_F,F_p, p.row_DOF_UpperBound);
252                       add_EM_F=TRUE;                         if (add_EM_S) Finley_Assemble_addToSystemMatrix(Mat,p.row_numShapesTotal,row_index,p.numEqu,p.col_numShapesTotal,row_index,p.numComp,EM_S);
253                       if (extendedX) {                    } /* end of isub */
                         for (s=0;s<p.row_NS;s++) {  
                           rtmp=0;  
                           for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*X_p[INDEX2(0,q,DIM)];  
                           EM_F[INDEX2(0,s,p.numEqu)]+=rtmp;  
                         }  
                      } else {  
                         for (s=0;s<p.row_NS;s++) {  
                           rtmp=0;  
                           for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)];  
                           EM_F[INDEX2(0,s,p.numEqu)]+=rtmp*X_p[0];  
                         }  
                      }  
                   }  
                   /**************************************************************/  
                   /*   process Y: */  
                   /**************************************************************/  
                    Y_p=getSampleData(Y,e);  
                    if (NULL!=Y_p) {  
                      add_EM_F=TRUE;  
                      if (extendedY) {  
                         for (s=0;s<p.row_NS;s++) {  
                            rtmp=0;  
                            for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*Y_p[q];  
                            EM_F[INDEX2(0,s,p.numEqu)]+=rtmp;  
                         }  
                       } else {  
                         for (s=0;s<p.row_NS;s++) {  
                             rtmp=0;  
                             for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)];  
                             EM_F[INDEX2(0,s,p.numEqu)]+=rtmp*Y_p[0];  
                         }  
                       }  
                     }  
                     /***********************************************************************************************/  
                     /* add the element matrices onto the matrix and right hand side                                */  
                     /***********************************************************************************************/  
                     for (q=0;q<p.row_NN;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[q],e,p.NN)]];  
                     if (add_EM_F) Finley_Util_AddScatter(p.row_NN,row_index,p.numEqu,EM_F,F_p, p.row_DOF_UpperBound);  
                     if (add_EM_S) Finley_Assemble_addToSystemMatrix(Mat,p.row_NN,row_index,p.numEqu,p.col_NN,row_index,p.numComp,EM_S);  
254        
255                  } /* end color check */                  } /* end color check */
256               } /* end element loop */               } /* end element loop */
257           } /* end color loop */           } /* end color loop */
258                        
259           THREAD_MEMFREE(EM_S);           THREAD_MEMFREE(EM_S);      /* these FREEs appear to be inside the if because if any of the allocs */
260           THREAD_MEMFREE(EM_F);           THREAD_MEMFREE(EM_F);      /* failed it means an out of memory (which is not recoverable anyway) */
261           THREAD_MEMFREE(row_index);           THREAD_MEMFREE(row_index);
262    
263        } /* end of pointer check */        } /* end of pointer check */

Legend:
Removed from v.853  
changed lines
  Added in v.2770

  ViewVC Help
Powered by ViewVC 1.1.26