/[escript]/branches/domexper/dudley/src/Assemble_PDE_System2_3D.c
ViewVC logotype

Diff of /branches/domexper/dudley/src/Assemble_PDE_System2_3D.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

trunk/finley/src/Assemble_PDE_System2_3D.c revision 1811 by ksteube, Thu Sep 25 23:11:13 2008 UTC branches/domexper/dudley/src/Assemble_PDE_System2_3D.c revision 3187 by jfenwick, Thu Sep 16 02:57:17 2010 UTC
# Line 1  Line 1 
1    
2  /*******************************************************  /*******************************************************
3  *  *
4  * Copyright (c) 2003-2008 by University of Queensland  * Copyright (c) 2003-2010 by University of Queensland
5  * Earth Systems Science Computational Center (ESSCC)  * Earth Systems Science Computational Center (ESSCC)
6  * http://www.uq.edu.au/esscc  * http://www.uq.edu.au/esscc
7  *  *
# Line 11  Line 11 
11  *  *
12  *******************************************************/  *******************************************************/
13    
   
14  /**************************************************************/  /**************************************************************/
15    
16  /*    assembles the system of numEq PDEs into the stiffness matrix S right hand side F  */  /*    assembles the system of numEq PDEs into the stiffness matrix S right hand side F  */
17  /*    the shape functions for test and solution must be identical */  /*    the shape functions for test and solution must be identical */
18    
   
19  /*      -(A_{k,i,m,j} u_m,j)_i-(B_{k,i,m} u_m)_i+C_{k,m,j} u_m,j-D_{k,m} u_m  and -(X_{k,i})_i + Y_k */  /*      -(A_{k,i,m,j} u_m,j)_i-(B_{k,i,m} u_m)_i+C_{k,m,j} u_m,j-D_{k,m} u_m  and -(X_{k,i})_i + Y_k */
20    
21  /*    u has p.numComp components in a 3D domain. The shape functions for test and solution must be identical  */  /*    u has p.numComp components in a 3D domain. The shape functions for test and solution must be identical  */
# Line 32  Line 30 
30  /*      X = p.numEqu x 3  */  /*      X = p.numEqu x 3  */
31  /*      Y = p.numEqu   */  /*      Y = p.numEqu   */
32    
   
33  /**************************************************************/  /**************************************************************/
34    
   
35  #include "Assemble.h"  #include "Assemble.h"
36  #include "Util.h"  #include "Util.h"
37  #ifdef _OPENMP  #ifdef _OPENMP
38  #include <omp.h>  #include <omp.h>
39  #endif  #endif
40    
   
41  /**************************************************************/  /**************************************************************/
42    
43  void  Finley_Assemble_PDE_System2_3D(Assemble_Parameters p, Finley_ElementFile* elements,  void Dudley_Assemble_PDE_System2_3D(Assemble_Parameters p, Dudley_ElementFile * elements,
44                                       Paso_SystemMatrix* Mat, escriptDataC* F,                      Paso_SystemMatrix * Mat, escriptDataC * F,
45                                       escriptDataC* A, escriptDataC* B, escriptDataC* C, escriptDataC* D, escriptDataC* X, escriptDataC* Y) {                      escriptDataC * A, escriptDataC * B, escriptDataC * C, escriptDataC * D,
46                        escriptDataC * X, escriptDataC * Y)
47    {
48    
49      #define DIM 3  #define DIM 3
50      index_t color;      index_t color;
51      dim_t e;      dim_t e;
52      double *EM_S, *EM_F, *Vol, *DSDX, *A_p, *B_p, *C_p, *D_p, *X_p, *Y_p;      __const double *A_p, *B_p, *C_p, *D_p, *X_p, *Y_p, *A_q, *B_q, *C_q, *D_q, *X_q, *Y_q;
53        double *EM_S, *EM_F, *DSDX;
54      index_t *row_index;      index_t *row_index;
55      register dim_t q, s,r,k,m;      register dim_t q, s, r, k, m;
56      register double rtmp, rtmp0, rtmp1, rtmp2, rtmp00, rtmp01, rtmp02, rtmp10, rtmp11, rtmp12, rtmp20, rtmp21, rtmp22;      register double rtmp, rtmp0, rtmp1, rtmp2, rtmp00, rtmp01, rtmp02, rtmp10, rtmp11, rtmp12, rtmp20, rtmp21, rtmp22;
57      bool_t add_EM_F, add_EM_S;      bool_t add_EM_F, add_EM_S;
58    
59      bool_t extendedA=isExpanded(A);      bool_t extendedA = isExpanded(A);
60      bool_t extendedB=isExpanded(B);      bool_t extendedB = isExpanded(B);
61      bool_t extendedC=isExpanded(C);      bool_t extendedC = isExpanded(C);
62      bool_t extendedD=isExpanded(D);      bool_t extendedD = isExpanded(D);
63      bool_t extendedX=isExpanded(X);      bool_t extendedX = isExpanded(X);
64      bool_t extendedY=isExpanded(Y);      bool_t extendedY = isExpanded(Y);
65      double *F_p=getSampleData(F,0);      double *F_p = (requireWrite(F), getSampleDataRW(F, 0)); /* use comma, to get around the mixed code and declarations thing */
66      double *S=p.row_jac->ReferenceElement->S;      double *S = p.row_jac->BasisFunctions->S;
67      dim_t len_EM_S=p.row_NN*p.col_NN*p.numEqu*p.numComp;      dim_t len_EM_S = p.row_numShapesTotal * p.col_numShapesTotal * p.numEqu * p.numComp;
68      dim_t len_EM_F=p.row_NN*p.numEqu;      dim_t len_EM_F = p.row_numShapesTotal * p.numEqu;
   
69    
70      #pragma omp parallel private(color,EM_S, EM_F, Vol, DSDX, A_p, B_p, C_p, D_p, X_p, Y_p,row_index,q, s,r,k,m,rtmp, rtmp0, rtmp1, rtmp2, rtmp00, rtmp01, rtmp02, rtmp10, rtmp11, rtmp12, rtmp20, rtmp21, rtmp22,add_EM_F, add_EM_S)  #pragma omp parallel private(color,EM_S, EM_F, Vol, DSDX, A_p, B_p, C_p, D_p, X_p, Y_p, A_q, B_q, C_q, D_q, X_q, Y_q,row_index,q, s,r,k,m,rtmp, rtmp0, rtmp1, rtmp2, rtmp00, rtmp01, rtmp02, rtmp10, rtmp11, rtmp12, rtmp20, rtmp21, rtmp22,add_EM_F, add_EM_S)
71      {      {
72         EM_S=THREAD_MEMALLOC(len_EM_S,double);      EM_S = THREAD_MEMALLOC(len_EM_S, double);
73         EM_F=THREAD_MEMALLOC(len_EM_F,double);      EM_F = THREAD_MEMALLOC(len_EM_F, double);
74         row_index=THREAD_MEMALLOC(p.row_NN,index_t);      row_index = THREAD_MEMALLOC(p.row_numShapesTotal, index_t);
75                                                                                                                                                                                                        
76         if (!Finley_checkPtr(EM_S) && !Finley_checkPtr(EM_F) && !Finley_checkPtr(row_index) ) {      if (!Dudley_checkPtr(EM_S) && !Dudley_checkPtr(EM_F) && !Dudley_checkPtr(row_index))
77        {
78            for (color=elements->minColor;color<=elements->maxColor;color++) {  
79               /*  open loop over all elements: */          for (color = elements->minColor; color <= elements->maxColor; color++)
80               #pragma omp for private(e) schedule(static)          {
81               for(e=0;e<elements->numElements;e++){          /*  open loop over all elements: */
82                  if (elements->Color[e]==color) {  #pragma omp for private(e) schedule(static)
83                     Vol=&(p.row_jac->volume[INDEX2(0,e,p.numQuad)]);          for (e = 0; e < elements->numElements; e++)
84                     DSDX=&(p.row_jac->DSDX[INDEX4(0,0,0,e,p.row_NN,DIM,p.numQuad)]);          {
85                     for (q=0;q<len_EM_S;++q) EM_S[q]=0;              if (elements->Color[e] == color)
86                     for (q=0;q<len_EM_F;++q) EM_F[q]=0;              {
87                     add_EM_F=FALSE;  
88                     add_EM_S=FALSE;              A_p = getSampleDataRO(A, e);
89                     /**************************************************************/              B_p = getSampleDataRO(B, e);
90                     /*   process A: */              C_p = getSampleDataRO(C, e);
91                     /**************************************************************/              D_p = getSampleDataRO(D, e);
92                     A_p=getSampleData(A,e);              X_p = getSampleDataRO(X, e);
93                     if (NULL!=A_p) {              Y_p = getSampleDataRO(Y, e);
94                        add_EM_S=TRUE;              double vol = p.row_jac->absD[e] * p.row_jac->quadweight;
95                        if (extendedA) {  
96                           for (s=0;s<p.row_NS;s++) {              DSDX = &(p.row_jac->DSDX[INDEX5(0, 0, 0, 0, e, p.row_numShapesTotal, DIM, p.numQuadTotal, 1)]);
97                             for (r=0;r<p.col_NS;r++) {              for (q = 0; q < len_EM_S; ++q)
98                               for (k=0;k<p.numEqu;k++) {                  EM_S[q] = 0;
99                                 for (m=0;m<p.numComp;m++) {              for (q = 0; q < len_EM_F; ++q)
100                                    rtmp=0;                  EM_F[q] = 0;
101                                    for (q=0;q<p.numQuad;q++) {              add_EM_F = FALSE;
102                                       rtmp+=Vol[q]*(              add_EM_S = FALSE;
103                                         DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*A_p[INDEX5(k,0,m,0,q,p.numEqu,DIM,p.numComp,DIM)]*DSDX[INDEX3(r,0,q,p.row_NN,DIM)]  
104                                        +DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*A_p[INDEX5(k,0,m,1,q,p.numEqu,DIM,p.numComp,DIM)]*DSDX[INDEX3(r,1,q,p.row_NN,DIM)]                /**************************************************************/
105                                        +DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*A_p[INDEX5(k,0,m,2,q,p.numEqu,DIM,p.numComp,DIM)]*DSDX[INDEX3(r,2,q,p.row_NN,DIM)]              /*   process A: */
106                                        +DSDX[INDEX3(s,1,q,p.row_NN,DIM)]*A_p[INDEX5(k,1,m,0,q,p.numEqu,DIM,p.numComp,DIM)]*DSDX[INDEX3(r,0,q,p.row_NN,DIM)]                /**************************************************************/
107                                        +DSDX[INDEX3(s,1,q,p.row_NN,DIM)]*A_p[INDEX5(k,1,m,1,q,p.numEqu,DIM,p.numComp,DIM)]*DSDX[INDEX3(r,1,q,p.row_NN,DIM)]              if (NULL != A_p)
108                                        +DSDX[INDEX3(s,1,q,p.row_NN,DIM)]*A_p[INDEX5(k,1,m,2,q,p.numEqu,DIM,p.numComp,DIM)]*DSDX[INDEX3(r,2,q,p.row_NN,DIM)]              {
109                                        +DSDX[INDEX3(s,2,q,p.row_NN,DIM)]*A_p[INDEX5(k,2,m,0,q,p.numEqu,DIM,p.numComp,DIM)]*DSDX[INDEX3(r,0,q,p.row_NN,DIM)]                  add_EM_S = TRUE;
110                                        +DSDX[INDEX3(s,2,q,p.row_NN,DIM)]*A_p[INDEX5(k,2,m,1,q,p.numEqu,DIM,p.numComp,DIM)]*DSDX[INDEX3(r,1,q,p.row_NN,DIM)]                  if (extendedA)
111                                        +DSDX[INDEX3(s,2,q,p.row_NN,DIM)]*A_p[INDEX5(k,2,m,2,q,p.numEqu,DIM,p.numComp,DIM)]*DSDX[INDEX3(r,2,q,p.row_NN,DIM)]);                  {
112                                              A_q = &(A_p[INDEX6(0, 0, 0, 0, 0, 0, p.numEqu, DIM, p.numComp, DIM, p.numQuadTotal)]);
113                                    }                  for (s = 0; s < p.row_numShapes; s++)
114                                    EM_S[INDEX4(k,m,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp;                  {
115                                 }                      for (r = 0; r < p.col_numShapes; r++)
116                               }                      {
117                             }                      for (k = 0; k < p.numEqu; k++)
118                           }                      {
119                        } else {                          for (m = 0; m < p.numComp; m++)
120                           for (s=0;s<p.row_NS;s++) {                          {
121                             for (r=0;r<p.col_NS;r++) {                          rtmp = 0;
122                                 rtmp00=0;                          for (q = 0; q < p.numQuadTotal; q++)
123                                 rtmp01=0;                          {
124                                 rtmp02=0;                              rtmp +=
125                                 rtmp10=0;                              vol * (DSDX[INDEX3(s, 0, q, p.row_numShapesTotal, DIM)] *
126                                 rtmp11=0;                                     A_q[INDEX5(k, 0, m, 0, q, p.numEqu, DIM, p.numComp, DIM)]
127                                 rtmp12=0;                                     * DSDX[INDEX3(r, 0, q, p.row_numShapesTotal, DIM)] +
128                                 rtmp20=0;                                     DSDX[INDEX3(s, 0, q, p.row_numShapesTotal, DIM)] *
129                                 rtmp21=0;                                     A_q[INDEX5(k, 0, m, 1, q, p.numEqu, DIM, p.numComp, DIM)]
130                                 rtmp22=0;                                     * DSDX[INDEX3(r, 1, q, p.row_numShapesTotal, DIM)] +
131                                 for (q=0;q<p.numQuad;q++) {                                     DSDX[INDEX3(s, 0, q, p.row_numShapesTotal, DIM)] *
132                                       rtmp0=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)];                                     A_q[INDEX5(k, 0, m, 2, q, p.numEqu, DIM, p.numComp, DIM)]
133                                       rtmp00+=rtmp0*DSDX[INDEX3(r,0,q,p.row_NN,DIM)];                                     * DSDX[INDEX3(r, 2, q, p.row_numShapesTotal, DIM)] +
134                                       rtmp01+=rtmp0*DSDX[INDEX3(r,1,q,p.row_NN,DIM)];                                     DSDX[INDEX3(s, 1, q, p.row_numShapesTotal, DIM)] *
135                                       rtmp02+=rtmp0*DSDX[INDEX3(r,2,q,p.row_NN,DIM)];                                     A_q[INDEX5(k, 1, m, 0, q, p.numEqu, DIM, p.numComp, DIM)]
136                                         * DSDX[INDEX3(r, 0, q, p.row_numShapesTotal, DIM)] +
137                                       rtmp1=Vol[q]*DSDX[INDEX3(s,1,q,p.row_NN,DIM)];                                     DSDX[INDEX3(s, 1, q, p.row_numShapesTotal, DIM)] *
138                                       rtmp10+=rtmp1*DSDX[INDEX3(r,0,q,p.row_NN,DIM)];                                     A_q[INDEX5(k, 1, m, 1, q, p.numEqu, DIM, p.numComp, DIM)]
139                                       rtmp11+=rtmp1*DSDX[INDEX3(r,1,q,p.row_NN,DIM)];                                     * DSDX[INDEX3(r, 1, q, p.row_numShapesTotal, DIM)] +
140                                       rtmp12+=rtmp1*DSDX[INDEX3(r,2,q,p.row_NN,DIM)];                                     DSDX[INDEX3(s, 1, q, p.row_numShapesTotal, DIM)] *
141                                         A_q[INDEX5(k, 1, m, 2, q, p.numEqu, DIM, p.numComp, DIM)]
142                                       rtmp2=Vol[q]*DSDX[INDEX3(s,2,q,p.row_NN,DIM)];                                     * DSDX[INDEX3(r, 2, q, p.row_numShapesTotal, DIM)] +
143                                       rtmp20+=rtmp2*DSDX[INDEX3(r,0,q,p.row_NN,DIM)];                                     DSDX[INDEX3(s, 2, q, p.row_numShapesTotal, DIM)] *
144                                       rtmp21+=rtmp2*DSDX[INDEX3(r,1,q,p.row_NN,DIM)];                                     A_q[INDEX5(k, 2, m, 0, q, p.numEqu, DIM, p.numComp, DIM)]
145                                       rtmp22+=rtmp2*DSDX[INDEX3(r,2,q,p.row_NN,DIM)];                                     * DSDX[INDEX3(r, 0, q, p.row_numShapesTotal, DIM)] +
146                                 }                                     DSDX[INDEX3(s, 2, q, p.row_numShapesTotal, DIM)] *
147                                 for (k=0;k<p.numEqu;k++) {                                     A_q[INDEX5(k, 2, m, 1, q, p.numEqu, DIM, p.numComp, DIM)]
148                                    for (m=0;m<p.numComp;m++) {                                     * DSDX[INDEX3(r, 1, q, p.row_numShapesTotal, DIM)] +
149                                       EM_S[INDEX4(k,m,s,r,p.numEqu,p.numComp,p.row_NN)]+= rtmp00*A_p[INDEX4(k,0,m,0,p.numEqu,DIM,p.numComp)]                                     DSDX[INDEX3(s, 2, q, p.row_numShapesTotal, DIM)] *
150                                                                                          +rtmp01*A_p[INDEX4(k,0,m,1,p.numEqu,DIM,p.numComp)]                                     A_q[INDEX5(k, 2, m, 2, q, p.numEqu, DIM, p.numComp, DIM)]
151                                                                                          +rtmp02*A_p[INDEX4(k,0,m,2,p.numEqu,DIM,p.numComp)]                                     * DSDX[INDEX3(r, 2, q, p.row_numShapesTotal, DIM)]);
152                                                                                          +rtmp10*A_p[INDEX4(k,1,m,0,p.numEqu,DIM,p.numComp)]  
153                                                                                          +rtmp11*A_p[INDEX4(k,1,m,1,p.numEqu,DIM,p.numComp)]                          }
154                                                                                          +rtmp12*A_p[INDEX4(k,1,m,2,p.numEqu,DIM,p.numComp)]                          EM_S[INDEX4(k, m, s, r, p.numEqu, p.numComp, p.row_numShapesTotal)] +=
155                                                                                          +rtmp20*A_p[INDEX4(k,2,m,0,p.numEqu,DIM,p.numComp)]                              rtmp;
156                                                                                          +rtmp21*A_p[INDEX4(k,2,m,1,p.numEqu,DIM,p.numComp)]                          }
157                                                                                          +rtmp22*A_p[INDEX4(k,2,m,2,p.numEqu,DIM,p.numComp)];                      }
158                                    }                      }
159                                 }                  }
160                             }                  } else
161                           }                  {
162                         }                  for (s = 0; s < p.row_numShapes; s++)
163                     }                  {
164                     /**************************************************************/                      for (r = 0; r < p.col_numShapes; r++)
165                     /*   process B: */                      {
166                     /**************************************************************/                      rtmp00 = 0;
167                     B_p=getSampleData(B,e);                      rtmp01 = 0;
168                     if (NULL!=B_p) {                      rtmp02 = 0;
169                        add_EM_S=TRUE;                      rtmp10 = 0;
170                        if (extendedB) {                      rtmp11 = 0;
171                           for (s=0;s<p.row_NS;s++) {                      rtmp12 = 0;
172                             for (r=0;r<p.col_NS;r++) {                      rtmp20 = 0;
173                               for (k=0;k<p.numEqu;k++) {                      rtmp21 = 0;
174                                 for (m=0;m<p.numComp;m++) {                      rtmp22 = 0;
175                                    rtmp=0;                      for (q = 0; q < p.numQuadTotal; q++)
176                                    for (q=0;q<p.numQuad;q++) {                      {
177                                        rtmp+=Vol[q]*S[INDEX2(r,q,p.row_NS)]*(                          rtmp0 = vol * DSDX[INDEX3(s, 0, q, p.row_numShapesTotal, DIM)];
178                                                DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*B_p[INDEX4(k,0,m,q,p.numEqu,DIM,p.numComp)]                          rtmp00 += rtmp0 * DSDX[INDEX3(r, 0, q, p.row_numShapesTotal, DIM)];
179                                              + DSDX[INDEX3(s,1,q,p.row_NN,DIM)]*B_p[INDEX4(k,1,m,q,p.numEqu,DIM,p.numComp)]                          rtmp01 += rtmp0 * DSDX[INDEX3(r, 1, q, p.row_numShapesTotal, DIM)];
180                                              + DSDX[INDEX3(s,2,q,p.row_NN,DIM)]*B_p[INDEX4(k,2,m,q,p.numEqu,DIM,p.numComp)] );                          rtmp02 += rtmp0 * DSDX[INDEX3(r, 2, q, p.row_numShapesTotal, DIM)];
181                                    }  
182                                    EM_S[INDEX4(k,m,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp;                          rtmp1 = vol * DSDX[INDEX3(s, 1, q, p.row_numShapesTotal, DIM)];
183                                 }                          rtmp10 += rtmp1 * DSDX[INDEX3(r, 0, q, p.row_numShapesTotal, DIM)];
184                               }                          rtmp11 += rtmp1 * DSDX[INDEX3(r, 1, q, p.row_numShapesTotal, DIM)];
185                             }                          rtmp12 += rtmp1 * DSDX[INDEX3(r, 2, q, p.row_numShapesTotal, DIM)];
186                           }  
187                        } else {                          rtmp2 = vol * DSDX[INDEX3(s, 2, q, p.row_numShapesTotal, DIM)];
188                           for (s=0;s<p.row_NS;s++) {                          rtmp20 += rtmp2 * DSDX[INDEX3(r, 0, q, p.row_numShapesTotal, DIM)];
189                             for (r=0;r<p.col_NS;r++) {                          rtmp21 += rtmp2 * DSDX[INDEX3(r, 1, q, p.row_numShapesTotal, DIM)];
190                                    rtmp0=0;                          rtmp22 += rtmp2 * DSDX[INDEX3(r, 2, q, p.row_numShapesTotal, DIM)];
191                                    rtmp1=0;                      }
192                                    rtmp2=0;                      for (k = 0; k < p.numEqu; k++)
193                                    for (q=0;q<p.numQuad;q++) {                      {
194                                         rtmp=Vol[q]*S[INDEX2(r,q,p.row_NS)];                          for (m = 0; m < p.numComp; m++)
195                                         rtmp0+=rtmp*DSDX[INDEX3(s,0,q,p.row_NN,DIM)];                          {
196                                         rtmp1+=rtmp*DSDX[INDEX3(s,1,q,p.row_NN,DIM)];                          EM_S[INDEX4(k, m, s, r, p.numEqu, p.numComp, p.row_numShapesTotal)] +=
197                                         rtmp2+=rtmp*DSDX[INDEX3(s,2,q,p.row_NN,DIM)];                              rtmp00 * A_p[INDEX4(k, 0, m, 0, p.numEqu, DIM, p.numComp)] +
198                                    }                              rtmp01 * A_p[INDEX4(k, 0, m, 1, p.numEqu, DIM, p.numComp)] +
199                                    for (k=0;k<p.numEqu;k++) {                              rtmp02 * A_p[INDEX4(k, 0, m, 2, p.numEqu, DIM, p.numComp)] +
200                                       for (m=0;m<p.numComp;m++) {                              rtmp10 * A_p[INDEX4(k, 1, m, 0, p.numEqu, DIM, p.numComp)] +
201                                          EM_S[INDEX4(k,m,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp0*B_p[INDEX3(k,0,m,p.numEqu,DIM)]                              rtmp11 * A_p[INDEX4(k, 1, m, 1, p.numEqu, DIM, p.numComp)] +
202                                                                                            +rtmp1*B_p[INDEX3(k,1,m,p.numEqu,DIM)]                              rtmp12 * A_p[INDEX4(k, 1, m, 2, p.numEqu, DIM, p.numComp)] +
203                                                                                            +rtmp2*B_p[INDEX3(k,2,m,p.numEqu,DIM)];                              rtmp20 * A_p[INDEX4(k, 2, m, 0, p.numEqu, DIM, p.numComp)] +
204                                       }                              rtmp21 * A_p[INDEX4(k, 2, m, 1, p.numEqu, DIM, p.numComp)] +
205                                    }                              rtmp22 * A_p[INDEX4(k, 2, m, 2, p.numEqu, DIM, p.numComp)];
206                             }                          }
207                           }                      }
208                        }                      }
209                     }                  }
210                     /**************************************************************/                  }
211                     /*   process C: */              }
212                     /**************************************************************/                /**************************************************************/
213                     C_p=getSampleData(C,e);              /*   process B: */
214                     if (NULL!=C_p) {                /**************************************************************/
215                       add_EM_S=TRUE;              if (NULL != B_p)
216                       if (extendedC) {              {
217                           for (s=0;s<p.row_NS;s++) {                  add_EM_S = TRUE;
218                             for (r=0;r<p.col_NS;r++) {                  if (extendedB)
219                               for (k=0;k<p.numEqu;k++) {                  {
220                                 for (m=0;m<p.numComp;m++) {                  B_q = &(B_p[INDEX5(0, 0, 0, 0, 0, p.numEqu, DIM, p.numComp, p.numQuadTotal)]);
221                                   rtmp=0;                  for (s = 0; s < p.row_numShapes; s++)
222                                   for (q=0;q<p.numQuad;q++) {                  {
223                                        rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*(                      for (r = 0; r < p.col_numShapes; r++)
224                                                   C_p[INDEX4(k,m,0,q,p.numEqu,p.numComp,DIM)]*DSDX[INDEX3(r,0,q,p.row_NN,DIM)]                      {
225                                                  +C_p[INDEX4(k,m,1,q,p.numEqu,p.numComp,DIM)]*DSDX[INDEX3(r,1,q,p.row_NN,DIM)]                      for (k = 0; k < p.numEqu; k++)
226                                                  +C_p[INDEX4(k,m,2,q,p.numEqu,p.numComp,DIM)]*DSDX[INDEX3(r,2,q,p.row_NN,DIM)]);                      {
227                                   }                          for (m = 0; m < p.numComp; m++)
228                                   EM_S[INDEX4(k,m,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp;                          {
229                                 }                          rtmp = 0;
230                               }                          for (q = 0; q < p.numQuadTotal; q++)
231                             }                          {
232                           }                              rtmp +=
233                       } else {                              vol * S[INDEX2(r, q, p.row_numShapes)] *
234                           for (s=0;s<p.row_NS;s++) {                              (DSDX[INDEX3(s, 0, q, p.row_numShapesTotal, DIM)] *
235                             for (r=0;r<p.col_NS;r++) {                               B_q[INDEX4(k, 0, m, q, p.numEqu, DIM, p.numComp)] +
236                                    rtmp0=0;                               DSDX[INDEX3(s, 1, q, p.row_numShapesTotal, DIM)] *
237                                    rtmp1=0;                               B_q[INDEX4(k, 1, m, q, p.numEqu, DIM, p.numComp)] +
238                                    rtmp2=0;                               DSDX[INDEX3(s, 2, q, p.row_numShapesTotal, DIM)] *
239                                    for (q=0;q<p.numQuad;q++) {                               B_q[INDEX4(k, 2, m, q, p.numEqu, DIM, p.numComp)]);
240                                       rtmp=Vol[q]*S[INDEX2(s,q,p.row_NS)];                          }
241                                       rtmp0+=rtmp*DSDX[INDEX3(r,0,q,p.row_NN,DIM)];                          EM_S[INDEX4(k, m, s, r, p.numEqu, p.numComp, p.row_numShapesTotal)] +=
242                                       rtmp1+=rtmp*DSDX[INDEX3(r,1,q,p.row_NN,DIM)];                              rtmp;
243                                       rtmp2+=rtmp*DSDX[INDEX3(r,2,q,p.row_NN,DIM)];                          }
244                                    }                      }
245                                    for (k=0;k<p.numEqu;k++) {                      }
246                                       for (m=0;m<p.numComp;m++) {                  }
247                                             EM_S[INDEX4(k,m,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp0*C_p[INDEX3(k,m,0,p.numEqu,p.numComp)]                  } else
248                                                                                               +rtmp1*C_p[INDEX3(k,m,1,p.numEqu,p.numComp)]                  {
249                                                                                               +rtmp2*C_p[INDEX3(k,m,2,p.numEqu,p.numComp)];                  for (s = 0; s < p.row_numShapes; s++)
250                                        }                  {
251                                    }                      for (r = 0; r < p.col_numShapes; r++)
252                             }                      {
253                           }                      rtmp0 = 0;
254                       }                      rtmp1 = 0;
255                     }                      rtmp2 = 0;
256                     /************************************************************* */                      for (q = 0; q < p.numQuadTotal; q++)
257                     /* process D */                      {
258                     /**************************************************************/                          rtmp = vol * S[INDEX2(r, q, p.row_numShapes)];
259                     D_p=getSampleData(D,e);                          rtmp0 += rtmp * DSDX[INDEX3(s, 0, q, p.row_numShapesTotal, DIM)];
260                     if (NULL!=D_p) {                          rtmp1 += rtmp * DSDX[INDEX3(s, 1, q, p.row_numShapesTotal, DIM)];
261                       add_EM_S=TRUE;                          rtmp2 += rtmp * DSDX[INDEX3(s, 2, q, p.row_numShapesTotal, DIM)];
262                       if (extendedD) {                      }
263                           for (s=0;s<p.row_NS;s++) {                      for (k = 0; k < p.numEqu; k++)
264                             for (r=0;r<p.col_NS;r++) {                      {
265                               for (k=0;k<p.numEqu;k++) {                          for (m = 0; m < p.numComp; m++)
266                                 for (m=0;m<p.numComp;m++) {                          {
267                                   rtmp=0;                          EM_S[INDEX4(k, m, s, r, p.numEqu, p.numComp, p.row_numShapesTotal)] +=
268                                   for (q=0;q<p.numQuad;q++) {                              rtmp0 * B_p[INDEX3(k, 0, m, p.numEqu, DIM)] +
269                                       rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*D_p[INDEX3(k,m,q,p.numEqu,p.numComp)]*S[INDEX2(r,q,p.row_NS)];                              rtmp1 * B_p[INDEX3(k, 1, m, p.numEqu, DIM)] +
270                                   }                              rtmp2 * B_p[INDEX3(k, 2, m, p.numEqu, DIM)];
271                                   EM_S[INDEX4(k,m,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp;                          }
272                                 }                      }
273                               }                      }
274                             }                  }
275                           }                  }
276                       } else {              }
277                           for (s=0;s<p.row_NS;s++) {                /**************************************************************/
278                             for (r=0;r<p.col_NS;r++) {              /*   process C: */
279                                 rtmp=0;                /**************************************************************/
280                                 for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*S[INDEX2(r,q,p.row_NS)];              if (NULL != C_p)
281                                 for (k=0;k<p.numEqu;k++) {              {
282                                     for (m=0;m<p.numComp;m++) {                  add_EM_S = TRUE;
283                                       EM_S[INDEX4(k,m,s,r,p.numEqu,p.numComp,p.row_NN)]+=rtmp*D_p[INDEX2(k,m,p.numEqu)];                  if (extendedC)
284                                    }                  {
285                                 }                  C_q = &(C_p[INDEX5(0, 0, 0, 0, 0, p.numEqu, p.numComp, DIM, p.numQuadTotal)]);
286                             }                  for (s = 0; s < p.row_numShapes; s++)
287                           }                  {
288                       }                      for (r = 0; r < p.col_numShapes; r++)
289                     }                      {
290                     /**************************************************************/                      for (k = 0; k < p.numEqu; k++)
291                     /*   process X: */                      {
292                     /**************************************************************/                          for (m = 0; m < p.numComp; m++)
293                     X_p=getSampleData(X,e);                          {
294                     if (NULL!=X_p) {                          rtmp = 0;
295                       add_EM_F=TRUE;                          for (q = 0; q < p.numQuadTotal; q++)
296                       if (extendedX) {                          {
297                          for (s=0;s<p.row_NS;s++) {                              rtmp +=
298                             for (k=0;k<p.numEqu;k++) {                              vol * S[INDEX2(s, q, p.row_numShapes)] *
299                                rtmp=0;                              (C_q[INDEX4(k, m, 0, q, p.numEqu, p.numComp, DIM)] *
300                                for (q=0;q<p.numQuad;q++) {                               DSDX[INDEX3(r, 0, q, p.row_numShapesTotal, DIM)] +
301                                      rtmp+=Vol[q]* ( DSDX[INDEX3(s,0,q,p.row_NN,DIM)]*X_p[INDEX3(k,0,q,p.numEqu,DIM)]                               C_q[INDEX4(k, m, 1, q, p.numEqu, p.numComp, DIM)] *
302                                                    + DSDX[INDEX3(s,1,q,p.row_NN,DIM)]*X_p[INDEX3(k,1,q,p.numEqu,DIM)]                               DSDX[INDEX3(r, 1, q, p.row_numShapesTotal, DIM)] +
303                                                    + DSDX[INDEX3(s,2,q,p.row_NN,DIM)]*X_p[INDEX3(k,2,q,p.numEqu,DIM)]);                               C_q[INDEX4(k, m, 2, q, p.numEqu, p.numComp, DIM)] *
304                                }                               DSDX[INDEX3(r, 2, q, p.row_numShapesTotal, DIM)]);
305                                EM_F[INDEX2(k,s,p.numEqu)]+=rtmp;                          }
306                             }                          EM_S[INDEX4(k, m, s, r, p.numEqu, p.numComp, p.row_numShapesTotal)] +=
307                          }                              rtmp;
308                       } else {                          }
309                          for (s=0;s<p.row_NS;s++) {                      }
310                            rtmp0=0;                      }
311                            rtmp1=0;                  }
312                            rtmp2=0;                  } else
313                            for (q=0;q<p.numQuad;q++) {                  {
314                               rtmp0+=Vol[q]*DSDX[INDEX3(s,0,q,p.row_NN,DIM)];                  for (s = 0; s < p.row_numShapes; s++)
315                               rtmp1+=Vol[q]*DSDX[INDEX3(s,1,q,p.row_NN,DIM)];                  {
316                               rtmp2+=Vol[q]*DSDX[INDEX3(s,2,q,p.row_NN,DIM)];                      for (r = 0; r < p.col_numShapes; r++)
317                            }                      {
318                            for (k=0;k<p.numEqu;k++) {                      rtmp0 = 0;
319                                      EM_F[INDEX2(k,s,p.numEqu)]+=rtmp0*X_p[INDEX2(k,0,p.numEqu)]                      rtmp1 = 0;
320                                                                 +rtmp1*X_p[INDEX2(k,1,p.numEqu)]                      rtmp2 = 0;
321                                                                 +rtmp2*X_p[INDEX2(k,2,p.numEqu)];                      for (q = 0; q < p.numQuadTotal; q++)
322                            }                      {
323                          }                          rtmp = vol * S[INDEX2(s, q, p.row_numShapes)];
324                       }                          rtmp0 += rtmp * DSDX[INDEX3(r, 0, q, p.row_numShapesTotal, DIM)];
325                    }                          rtmp1 += rtmp * DSDX[INDEX3(r, 1, q, p.row_numShapesTotal, DIM)];
326                    /**************************************************************/                          rtmp2 += rtmp * DSDX[INDEX3(r, 2, q, p.row_numShapesTotal, DIM)];
327                    /*   process Y: */                      }
328                    /**************************************************************/                      for (k = 0; k < p.numEqu; k++)
329                     Y_p=getSampleData(Y,e);                      {
330                     if (NULL!=Y_p) {                          for (m = 0; m < p.numComp; m++)
331                       add_EM_F=TRUE;                          {
332                       if (extendedY) {                          EM_S[INDEX4(k, m, s, r, p.numEqu, p.numComp, p.row_numShapesTotal)] +=
333                          for (s=0;s<p.row_NS;s++) {                              rtmp0 * C_p[INDEX3(k, m, 0, p.numEqu, p.numComp)] +
334                             for (k=0;k<p.numEqu;k++) {                              rtmp1 * C_p[INDEX3(k, m, 1, p.numEqu, p.numComp)] +
335                                rtmp=0.;                              rtmp2 * C_p[INDEX3(k, m, 2, p.numEqu, p.numComp)];
336                                for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*Y_p[INDEX2(k,q,p.numEqu)];                          }
337                                EM_F[INDEX2(k,s,p.numEqu)]+=rtmp;                      }
338                             }                      }
339                          }                  }
340                        } else {                  }
341                          for (s=0;s<p.row_NS;s++) {              }
342                              rtmp=0;                /************************************************************* */
343                              for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)];              /* process D */
344                              for (k=0;k<p.numEqu;k++) EM_F[INDEX2(k,s,p.numEqu)]+=rtmp*Y_p[k];                /**************************************************************/
345                          }              if (NULL != D_p)
346                        }              {
347                      }                  add_EM_S = TRUE;
348                      /***********************************************************************************************/                  if (extendedD)
349                      /* add the element matrices onto the matrix and right hand side                                */                  {
350                      /***********************************************************************************************/                  D_q = &(D_p[INDEX4(0, 0, 0, 0, p.numEqu, p.numComp, p.numQuadTotal)]);
351                      for (q=0;q<p.row_NN;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[q],e,p.NN)]];                  for (s = 0; s < p.row_numShapes; s++)
352                      if (add_EM_F) Finley_Util_AddScatter(p.row_NN,row_index,p.numEqu,EM_F,F_p, p.row_DOF_UpperBound);                  {
353                      if (add_EM_S) Finley_Assemble_addToSystemMatrix(Mat,p.row_NN,row_index,p.numEqu,p.col_NN,row_index,p.numComp,EM_S);                      for (r = 0; r < p.col_numShapes; r++)
354                          {
355                  } /* end color check */                      for (k = 0; k < p.numEqu; k++)
356               } /* end element loop */                      {
357           } /* end color loop */                          for (m = 0; m < p.numComp; m++)
358                                      {
359           THREAD_MEMFREE(EM_S);                          rtmp = 0;
360           THREAD_MEMFREE(EM_F);                          for (q = 0; q < p.numQuadTotal; q++)
361           THREAD_MEMFREE(row_index);                          {
362                                rtmp +=
363                                vol * S[INDEX2(s, q, p.row_numShapes)] *
364                                D_q[INDEX3(k, m, q, p.numEqu, p.numComp)] *
365                                S[INDEX2(r, q, p.row_numShapes)];
366                            }
367                            EM_S[INDEX4(k, m, s, r, p.numEqu, p.numComp, p.row_numShapesTotal)] +=
368                                rtmp;
369                            }
370                        }
371                        }
372                    }
373                    } else
374                    {
375                    for (s = 0; s < p.row_numShapes; s++)
376                    {
377                        for (r = 0; r < p.col_numShapes; r++)
378                        {
379                        rtmp = 0;
380                        for (q = 0; q < p.numQuadTotal; q++)
381                            rtmp +=
382                            vol * S[INDEX2(s, q, p.row_numShapes)] *
383                            S[INDEX2(r, q, p.row_numShapes)];
384                        for (k = 0; k < p.numEqu; k++)
385                        {
386                            for (m = 0; m < p.numComp; m++)
387                            {
388                            EM_S[INDEX4(k, m, s, r, p.numEqu, p.numComp, p.row_numShapesTotal)] +=
389                                rtmp * D_p[INDEX2(k, m, p.numEqu)];
390                            }
391                        }
392                        }
393                    }
394                    }
395                }
396                  /**************************************************************/
397                /*   process X: */
398                  /**************************************************************/
399                if (NULL != X_p)
400                {
401                    add_EM_F = TRUE;
402                    if (extendedX)
403                    {
404                    X_q = &(X_p[INDEX4(0, 0, 0, 0, p.numEqu, DIM, p.numQuadTotal)]);
405                    for (s = 0; s < p.row_numShapes; s++)
406                    {
407                        for (k = 0; k < p.numEqu; k++)
408                        {
409                        rtmp = 0;
410                        for (q = 0; q < p.numQuadTotal; q++)
411                        {
412                            rtmp +=
413                            vol * (DSDX[INDEX3(s, 0, q, p.row_numShapesTotal, DIM)] *
414                                   X_q[INDEX3(k, 0, q, p.numEqu, DIM)] +
415                                   DSDX[INDEX3(s, 1, q, p.row_numShapesTotal, DIM)] *
416                                   X_q[INDEX3(k, 1, q, p.numEqu, DIM)] +
417                                   DSDX[INDEX3(s, 2, q, p.row_numShapesTotal, DIM)] *
418                                   X_q[INDEX3(k, 2, q, p.numEqu, DIM)]);
419                        }
420                        EM_F[INDEX2(k, s, p.numEqu)] += rtmp;
421                        }
422                    }
423                    } else
424                    {
425                    for (s = 0; s < p.row_numShapes; s++)
426                    {
427                        rtmp0 = 0;
428                        rtmp1 = 0;
429                        rtmp2 = 0;
430                        for (q = 0; q < p.numQuadTotal; q++)
431                        {
432                        rtmp0 += vol * DSDX[INDEX3(s, 0, q, p.row_numShapesTotal, DIM)];
433                        rtmp1 += vol * DSDX[INDEX3(s, 1, q, p.row_numShapesTotal, DIM)];
434                        rtmp2 += vol * DSDX[INDEX3(s, 2, q, p.row_numShapesTotal, DIM)];
435                        }
436                        for (k = 0; k < p.numEqu; k++)
437                        {
438                        EM_F[INDEX2(k, s, p.numEqu)] += rtmp0 * X_p[INDEX2(k, 0, p.numEqu)]
439                            + rtmp1 * X_p[INDEX2(k, 1, p.numEqu)] + rtmp2 * X_p[INDEX2(k, 2, p.numEqu)];
440                        }
441                    }
442                    }
443                }
444                 /**************************************************************/
445                /*   process Y: */
446                 /**************************************************************/
447                if (NULL != Y_p)
448                {
449                    add_EM_F = TRUE;
450                    if (extendedY)
451                    {
452                    Y_q = &(Y_p[INDEX3(0, 0, 0, p.numEqu, p.numQuadTotal)]);
453                    for (s = 0; s < p.row_numShapes; s++)
454                    {
455                        for (k = 0; k < p.numEqu; k++)
456                        {
457                        rtmp = 0.;
458                        for (q = 0; q < p.numQuadTotal; q++)
459                            rtmp +=
460                            vol * S[INDEX2(s, q, p.row_numShapes)] * Y_q[INDEX2(k, q, p.numEqu)];
461                        EM_F[INDEX2(k, s, p.numEqu)] += rtmp;
462                        }
463                    }
464                    } else
465                    {
466                    for (s = 0; s < p.row_numShapes; s++)
467                    {
468                        rtmp = 0;
469                        for (q = 0; q < p.numQuadTotal; q++)
470                        rtmp += vol * S[INDEX2(s, q, p.row_numShapes)];
471                        for (k = 0; k < p.numEqu; k++)
472                        EM_F[INDEX2(k, s, p.numEqu)] += rtmp * Y_p[k];
473                    }
474                    }
475                }
476    
477                   /***********************************************************************************************/
478                /* add the element matrices onto the matrix and right hand side                                */
479                   /***********************************************************************************************/
480                for (q = 0; q < p.row_numShapesTotal; q++)
481                    row_index[q] = p.row_DOF[elements->Nodes[INDEX2(q, e, p.NN)]];
482    
483                if (add_EM_F)
484                    Dudley_Util_AddScatter(p.row_numShapesTotal, row_index, p.numEqu, EM_F, F_p,
485                               p.row_DOF_UpperBound);
486                if (add_EM_S)
487                    Dudley_Assemble_addToSystemMatrix(Mat, p.row_numShapesTotal, row_index, p.numEqu,
488                                      p.col_numShapesTotal, row_index, p.numComp, EM_S);
489                }       /* end color check */
490            }       /* end element loop */
491            }           /* end color loop */
492    
493            THREAD_MEMFREE(EM_S);
494            THREAD_MEMFREE(EM_F);
495            THREAD_MEMFREE(row_index);
496    
497        } /* end of pointer check */      }           /* end of pointer check */
498     } /* end parallel region */      }               /* end parallel region */
499  }  }
 /*  
  * $Log$  
  */  

Legend:
Removed from v.1811  
changed lines
  Added in v.3187

  ViewVC Help
Powered by ViewVC 1.1.26