/[escript]/branches/domexper/dudley/src/Assemble_PDE_Single2_1D.c
ViewVC logotype

Diff of /branches/domexper/dudley/src/Assemble_PDE_Single2_1D.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 798 by gross, Fri Aug 4 01:05:36 2006 UTC revision 2748 by gross, Tue Nov 17 07:32:59 2009 UTC
# Line 1  Line 1 
1  /*  
2   ************************************************************  /*******************************************************
3   *          Copyright 2006 by ACcESS MNRF                   *  *
4   *                                                          *  * Copyright (c) 2003-2009 by University of Queensland
5   *              http://www.access.edu.au                    *  * Earth Systems Science Computational Center (ESSCC)
6   *       Primary Business: Queensland, Australia            *  * http://www.uq.edu.au/esscc
7   *  Licensed under the Open Software License version 1.0    *  *
8   *     http://www.opensource.org/licenses/osl-3.0.php       *  * Primary Business: Queensland, Australia
9   *                                                          *  * Licensed under the Open Software License version 3.0
10   ************************************************************  * http://www.opensource.org/licenses/osl-3.0.php
11  */  *
12    *******************************************************/
13    
14    
15  /**************************************************************/  /**************************************************************/
16    
# Line 33  Line 35 
35    
36  /**************************************************************/  /**************************************************************/
37    
 /*  Author: gross@access.edu.au */  
 /*  Version: $Id:$ */  
   
 /**************************************************************/  
   
38    
39  #include "Assemble.h"  #include "Assemble.h"
40  #include "Util.h"  #include "Util.h"
41    #ifdef _OPENMP
42    #include <omp.h>
43    #endif
44    
45    
46  /**************************************************************/  /**************************************************************/
47    
# Line 50  void  Finley_Assemble_PDE_Single2_1D(Ass Line 51  void  Finley_Assemble_PDE_Single2_1D(Ass
51    
52      #define DIM 1      #define DIM 1
53      index_t color;      index_t color;
54      dim_t e;      dim_t e, isub;
55        __const double *A_p, *B_p, *C_p, *D_p, *X_p, *Y_p, *A_q, *B_q, *C_q, *D_q, *X_q, *Y_q;
56        double *EM_S, *EM_F, *Vol, *DSDX;
57        index_t *row_index;
58        register dim_t q, s,r;
59        register double rtmp;
60        bool_t add_EM_F, add_EM_S;
61    
62      bool_t extendedA=isExpanded(A);      bool_t extendedA=isExpanded(A);
63      bool_t extendedB=isExpanded(B);      bool_t extendedB=isExpanded(B);
64      bool_t extendedC=isExpanded(C);      bool_t extendedC=isExpanded(C);
65      bool_t extendedD=isExpanded(D);      bool_t extendedD=isExpanded(D);
66      bool_t extendedX=isExpanded(X);      bool_t extendedX=isExpanded(X);
67      bool_t extendedY=isExpanded(Y);      bool_t extendedY=isExpanded(Y);
68      double *F_p=getSampleData(F,0);      double *F_p=(requireWrite(F), getSampleDataRW(F,0));    /* use comma, to get around the mixed code and declarations thing */
69      double *S=p.row_jac->ReferenceElement->S;      double *S=p.row_jac->BasisFunctions->S;
70      dim_t len_EM_S=p.row_NN*p.col_NN;      dim_t len_EM_S=p.row_numShapesTotal*p.col_numShapesTotal;
71      dim_t len_EM_F=p.row_NN;      dim_t len_EM_F=p.row_numShapesTotal;
72    
73        void* ABuff=allocSampleBuffer(A);
74      #pragma omp parallel private(color)      void* BBuff=allocSampleBuffer(B);
75        void* CBuff=allocSampleBuffer(C);
76        void* DBuff=allocSampleBuffer(D);
77        void* XBuff=allocSampleBuffer(X);
78        void* YBuff=allocSampleBuffer(Y);
79        #pragma omp parallel private(color, EM_S, EM_F, Vol, DSDX, A_p, B_p, C_p, D_p, X_p, Y_p, A_q, B_q, C_q, D_q, X_q, Y_q, row_index, q, s,r,rtmp,add_EM_F, add_EM_S, isub)
80      {      {
81         double EM_S[len_EM_S], EM_F[len_EM_F];         EM_S=THREAD_MEMALLOC(len_EM_S,double);
82         index_t row_index[p.row_NN];         EM_F=THREAD_MEMALLOC(len_EM_F,double);
83         register dim_t q, s,r;         row_index=THREAD_MEMALLOC(p.row_numShapesTotal,index_t);
84         register double rtmp;  
85         double *Vol, *DSDX, *A_p, *B_p, *C_p, *D_p, *X_p, *Y_p;  
86         bool_t add_EM_F, add_EM_S;         if (!Finley_checkPtr(EM_S) && !Finley_checkPtr(EM_F) && !Finley_checkPtr(row_index) ) {
87         #ifndef PASO_MPI  
88         for (color=elements->minColor;color<=elements->maxColor;color++) {            for (color=elements->minColor;color<=elements->maxColor;color++) {
89            /*  open loop over all elements: */               /*  open loop over all elements: */
90            #pragma omp for private(e) schedule(static)               #pragma omp for private(e) schedule(static)
91            for(e=0;e<elements->numElements;e++){               for(e=0;e<elements->numElements;e++){
92               if (elements->Color[e]==color) {                  if (elements->Color[e]==color) {
93         #else  
94         {                    A_p=getSampleDataRO(A,e,ABuff);
95            for(e=0;e<elements->numElements;e++) {                    C_p=getSampleDataRO(C,e,CBuff);
96               {                    B_p=getSampleDataRO(B,e,BBuff);
97         #endif                    D_p=getSampleDataRO(D,e,DBuff);
98                  Vol=&(p.row_jac->volume[INDEX2(0,e,p.numQuad)]);                    X_p=getSampleDataRO(X,e,XBuff);
99                  DSDX=&(p.row_jac->DSDX[INDEX4(0,0,0,e,p.row_NN,DIM,p.numQuad)]);                    Y_p=getSampleDataRO(Y,e,YBuff);
100                  for (q=0;q<len_EM_S;++q) EM_S[q]=0;  
101                  for (q=0;q<len_EM_F;++q) EM_F[q]=0;                    for (isub=0; isub<p.numSub; isub++) {
102                  add_EM_F=FALSE;                        Vol=&(p.row_jac->volume[INDEX3(0,isub,e, p.numQuadSub,p.numSub)]);
103                  add_EM_S=FALSE;                        DSDX=&(p.row_jac->DSDX[INDEX5(0,0,0,isub,e, p.row_numShapesTotal,DIM,p.numQuadSub,p.numSub)]);
104                  /**************************************************************/                        for (q=0;q<len_EM_S;++q) EM_S[q]=0;
105                  /*   process A: */                        for (q=0;q<len_EM_F;++q) EM_F[q]=0;
106                  /**************************************************************/                        add_EM_F=FALSE;
107                  A_p=getSampleData(A,e);                        add_EM_S=FALSE;
108                  if (NULL!=A_p) {                        /**************************************************************/
109                     add_EM_S=TRUE;                        /*   process A: */
110                     if (extendedA) {                        /**************************************************************/
111                        for (s=0;s<p.row_NS;s++) {                        if (NULL!=A_p) {
112                          for (r=0;r<p.col_NS;r++) {                           add_EM_S=TRUE;
113                             rtmp=0;                           if (extendedA) {
114                             for (q=0;q<p.numQuad;q++) {                  A_q=&(A_p[INDEX4(0,0,0,isub, DIM,DIM,p.numQuadSub)]);
115                                rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*A_p[INDEX3(0,0,q,DIM,DIM)]*DSDX[INDEX3(r,0,q,p.row_NN,DIM)];                              for (s=0;s<p.row_numShapes;s++) {
116                            }                                for (r=0;r<p.col_numShapes;r++) {
117                            EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp;                                   rtmp=0;
118                          }                                   for (q=0;q<p.numQuadSub;q++) {
119                        }                                      rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_numShapesTotal,DIM)]*A_q[INDEX3(0,0,q,DIM,DIM)]*DSDX[INDEX3(r,0,q,p.row_numShapesTotal,DIM)];
120                     } else {                                  }
121                        for (s=0;s<p.row_NS;s++) {                                  EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp;
122                          for (r=0;r<p.col_NS;r++) {                                }
123                              rtmp=0;                              }
124                              for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*DSDX[INDEX3(r,0,q,p.row_NN,DIM)];                           } else {
125                              EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp*A_p[INDEX2(0,0,DIM)];                              for (s=0;s<p.row_numShapes;s++) {
126                          }                                for (r=0;r<p.col_numShapes;r++) {
127                        }                                    rtmp=0;
128                      }                                    for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_numShapesTotal,DIM)]*DSDX[INDEX3(r,0,q,p.row_numShapesTotal,DIM)];
129                  }                                    EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp*A_p[INDEX2(0,0,DIM)];
130                  /**************************************************************/                                }
131                  /*   process B: */                              }
                 /**************************************************************/  
                 B_p=getSampleData(B,e);  
                 if (NULL!=B_p) {  
                    add_EM_S=TRUE;  
                    if (extendedB) {  
                       for (s=0;s<p.row_NS;s++) {  
                         for (r=0;r<p.col_NS;r++) {  
                           rtmp=0;  
                           for (q=0;q<p.numQuad;q++) {  
                              rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*B_p[INDEX2(0,q,DIM)]*S[INDEX2(r,q,p.row_NS)];  
132                            }                            }
                           EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp;  
                         }  
133                        }                        }
134                     } else {                        /**************************************************************/
135                        for (s=0;s<p.row_NS;s++) {                        /*   process B: */
136                          for (r=0;r<p.col_NS;r++) {                        /**************************************************************/
137                              rtmp=0;                        if (NULL!=B_p) {
138                              for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*S[INDEX2(r,q,p.row_NS)];                           add_EM_S=TRUE;
139                              EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp*B_p[0];                           if (extendedB) {
140                          }                  B_q=&(B_p[INDEX3(0,0,isub, DIM, p.numQuadSub)]);
141                                for (s=0;s<p.row_numShapes;s++) {
142                                  for (r=0;r<p.col_numShapes;r++) {
143                                    rtmp=0;
144                                    for (q=0;q<p.numQuadSub;q++) {
145                                       rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_numShapesTotal,DIM)]*B_q[INDEX2(0,q,DIM)]*S[INDEX2(r,q,p.row_numShapes)];
146                                    }
147                                    EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp;
148                                  }
149                                }
150                             } else {
151                                for (s=0;s<p.row_numShapes;s++) {
152                                  for (r=0;r<p.col_numShapes;r++) {
153                                      rtmp=0;
154                                      for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_numShapesTotal,DIM)]*S[INDEX2(r,q,p.row_numShapes)];
155                                      EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp*B_p[0];
156                                  }
157                                }
158                             }
159                        }                        }
160                     }                        /**************************************************************/
161                  }                        /*   process C: */
162                  /**************************************************************/                        /**************************************************************/
163                  /*   process C: */                        if (NULL!=C_p) {
164                  /**************************************************************/                           add_EM_S=TRUE;
165                  C_p=getSampleData(C,e);                          if (extendedC) {
166                  if (NULL!=C_p) {                  C_q=&(C_p[INDEX3(0,0,isub, DIM, p.numQuadSub)]);
167                     add_EM_S=TRUE;                              for (s=0;s<p.row_numShapes;s++) {
168                    if (extendedC) {                                for (r=0;r<p.col_numShapes;r++) {
169                        for (s=0;s<p.row_NS;s++) {                                  rtmp=0;
170                          for (r=0;r<p.col_NS;r++) {                                  for (q=0;q<p.numQuadSub;q++) {
171                            rtmp=0;                                     rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)]*C_q[INDEX2(0,q,DIM)]*DSDX[INDEX3(r,0,q,p.row_numShapesTotal,DIM)];
172                            for (q=0;q<p.numQuad;q++) {                                  }
173                               rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*C_p[INDEX2(0,q,DIM)]*DSDX[INDEX3(r,0,q,p.row_NN,DIM)];                                  EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp;
174                            }                                }
175                            EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp;                              }
176                            } else {
177                                for (s=0;s<p.row_numShapes;s++) {
178                                  for (r=0;r<p.col_numShapes;r++) {
179                                     rtmp=0;
180                                     for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)]*DSDX[INDEX3(r,0,q,p.row_numShapesTotal,DIM)];
181                                     EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp*C_p[0];
182                                  }
183                                }
184                          }                          }
185                        }                        }
186                    } else {                        /************************************************************* */
187                        for (s=0;s<p.row_NS;s++) {                        /* process D */
188                          for (r=0;r<p.col_NS;r++) {                        /**************************************************************/
189                             rtmp=0;                        if (NULL!=D_p) {
190                             for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*DSDX[INDEX3(r,0,q,p.row_NN,DIM)];                          add_EM_S=TRUE;
191                             EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp*C_p[0];                          if (extendedD) {
192                    D_q=&(D_p[INDEX2(0,isub, p.numQuadSub)]);
193                                for (s=0;s<p.row_numShapes;s++) {
194                                  for (r=0;r<p.col_numShapes;r++) {
195                                     rtmp=0;
196                                     for (q=0;q<p.numQuadSub;q++) {
197                                        rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)]*D_q[q]*S[INDEX2(r,q,p.row_numShapes)];
198                                    }
199                                    EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp;
200                                  }
201                                }
202                            } else {
203                                for (s=0;s<p.row_numShapes;s++) {
204                                  for (r=0;r<p.col_numShapes;r++) {
205                                      rtmp=0;
206                                      for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)]*S[INDEX2(r,q,p.row_numShapes)];
207                                      EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_numShapesTotal)]+=rtmp*D_p[0];
208                                  }
209                                }
210                          }                          }
211                        }                        }
212                    }                        /**************************************************************/
213                  }                        /*   process X: */
214                  /************************************************************* */                        /**************************************************************/
215                  /* process D */                        if (NULL!=X_p) {
216                  /**************************************************************/                          add_EM_F=TRUE;
217                  D_p=getSampleData(D,e);                          if (extendedX) {
218                  if (NULL!=D_p) {                     X_q=&(X_p[INDEX3(0,0,isub, DIM,p.numQuadSub)]);
219                    add_EM_S=TRUE;                             for (s=0;s<p.row_numShapes;s++) {
220                    if (extendedD) {                               rtmp=0;
221                        for (s=0;s<p.row_NS;s++) {                               for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_numShapesTotal,DIM)]*X_q[INDEX2(0,q,DIM)];
222                          for (r=0;r<p.col_NS;r++) {                               EM_F[INDEX2(0,s,p.numEqu)]+=rtmp;
223                             rtmp=0;                             }
224                             for (q=0;q<p.numQuad;q++) {                          } else {
225                                rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*D_p[q]*S[INDEX2(r,q,p.row_NS)];                             for (s=0;s<p.row_numShapes;s++) {
226                            }                               rtmp=0;
227                            EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp;                               for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q, p.row_numShapesTotal,DIM)];
228                                 EM_F[INDEX2(0,s,p.numEqu)]+=rtmp*X_p[0];
229                               }
230                          }                          }
                       }  
                   } else {  
                       for (s=0;s<p.row_NS;s++) {  
                         for (r=0;r<p.col_NS;r++) {  
                             rtmp=0;  
                             for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*S[INDEX2(r,q,p.row_NS)];  
                             EM_S[INDEX4(0,0,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp*D_p[0];  
                         }  
                       }  
                   }  
                 }  
                 /**************************************************************/  
                 /*   process X: */  
                 /**************************************************************/  
                 X_p=getSampleData(X,e);  
                 if (NULL!=X_p) {  
                   add_EM_F=TRUE;  
                   if (extendedX) {  
                      for (s=0;s<p.row_NS;s++) {  
                        rtmp=0;  
                        for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*X_p[INDEX2(0,q,DIM)];  
                        EM_F[INDEX2(0,s,p.numEqu)]+=rtmp;  
                      }  
                   } else {  
                      for (s=0;s<p.row_NS;s++) {  
                        rtmp=0;  
                        for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)];  
                        EM_F[INDEX2(0,s,p.numEqu)]+=rtmp*X_p[0];  
231                       }                       }
232                    }                       /**************************************************************/
233                 }                       /*   process Y: */
234                 /**************************************************************/                       /**************************************************************/
235                 /*   process Y: */                        if (NULL!=Y_p) {
236                 /**************************************************************/                          add_EM_F=TRUE;
237                  Y_p=getSampleData(Y,e);                          if (extendedY) {
238                  if (NULL!=Y_p) {                 Y_q=&(Y_p[INDEX2(0,isub, p.numQuadSub)]);
239                    add_EM_F=TRUE;                             for (s=0;s<p.row_numShapes;s++) {
240                    if (extendedY) {                                rtmp=0;
241                       for (s=0;s<p.row_NS;s++) {                                for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)]*Y_q[q];
242                          rtmp=0;                                EM_F[INDEX2(0,s,p.numEqu)]+=rtmp;
243                          for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*Y_p[q];                             }
244                          EM_F[INDEX2(0,s,p.numEqu)]+=rtmp;                           } else {
245                       }                             for (s=0;s<p.row_numShapes;s++) {
246                     } else {                                 rtmp=0;
247                       for (s=0;s<p.row_NS;s++) {                                 for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)];
248                           rtmp=0;                                 EM_F[INDEX2(0,s,p.numEqu)]+=rtmp*Y_p[0];
249                           for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)];                             }
250                           EM_F[INDEX2(0,s,p.numEqu)]+=rtmp*Y_p[0];                           }
251                       }                         }
252                     }                         /***********************************************************************************************/
253                   }                         /* add the element matrices onto the matrix and right hand side                                */
254                   /***********************************************************************************************/                         /***********************************************************************************************/
255                   /* add the element matrices onto the matrix and right hand side                                */                         for (q=0;q<p.row_numShapesTotal;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[INDEX2(q,isub,p.row_numShapesTotal)],e,p.NN)]];
256                   /***********************************************************************************************/                
257                   for (q=0;q<p.row_NN;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[q],e,p.NN)]];                         if (add_EM_F) Finley_Util_AddScatter(p.row_numShapesTotal,row_index,p.numEqu,EM_F,F_p, p.row_DOF_UpperBound);
258                   if (add_EM_F) Finley_Util_AddScatter(p.row_NN,row_index,p.numEqu,EM_F,F_p, p.row_DOF_UpperBound);                         if (add_EM_S) Finley_Assemble_addToSystemMatrix(Mat,p.row_numShapesTotal,row_index,p.numEqu,p.col_numShapesTotal,row_index,p.numComp,EM_S);
259                   if (add_EM_S) Finley_Assemble_addToSystemMatrix(Mat,p.row_NN,row_index,p.numEqu,p.col_NN,row_index,p.numComp,EM_S);                    } /* end of isub */
260      
261               } /* end color check */                  } /* end color check */
262            } /* end element loop */               } /* end element loop */
263        } /* end color loop */           } /* end color loop */
264              
265             THREAD_MEMFREE(EM_S);      /* these FREEs appear to be inside the if because if any of the allocs */
266             THREAD_MEMFREE(EM_F);      /* failed it means an out of memory (which is not recoverable anyway) */
267             THREAD_MEMFREE(row_index);
268    
269          } /* end of pointer check */
270     } /* end parallel region */     } /* end parallel region */
271       freeSampleBuffer(ABuff);
272       freeSampleBuffer(BBuff);
273       freeSampleBuffer(CBuff);
274       freeSampleBuffer(DBuff);
275       freeSampleBuffer(XBuff);
276       freeSampleBuffer(YBuff);
277  }  }
278  /*  /*
279   * $Log$   * $Log$

Legend:
Removed from v.798  
changed lines
  Added in v.2748

  ViewVC Help
Powered by ViewVC 1.1.26