/[escript]/trunk/finley/src/Assemble_PDE_System2_C.c
ViewVC logotype

Diff of /trunk/finley/src/Assemble_PDE_System2_C.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 852 by gross, Fri Aug 4 01:05:36 2006 UTC revision 853 by gross, Wed Sep 20 05:56:36 2006 UTC
# Line 35  Line 35 
35    
36  #include "Assemble.h"  #include "Assemble.h"
37  #include "Util.h"  #include "Util.h"
38    #ifdef _OPENMP
39    #include <omp.h>
40    #endif
41    
42    
43  /**************************************************************/  /**************************************************************/
44    
# Line 43  void  Finley_Assemble_PDE_System2_C(Asse Line 47  void  Finley_Assemble_PDE_System2_C(Asse
47    
48      index_t color;      index_t color;
49      dim_t e;      dim_t e;
50        double *EM_S, *EM_F, *Vol, *D_p, *Y_p;
51        index_t *row_index;
52        register dim_t q, s,r,k,m;
53        register double rtmp, rtmp_D;
54        bool_t add_EM_F, add_EM_S;
55    
56      bool_t extendedD=isExpanded(D);      bool_t extendedD=isExpanded(D);
57      bool_t extendedY=isExpanded(Y);      bool_t extendedY=isExpanded(Y);
58      double *F_p=getSampleData(F,0);      double *F_p=getSampleData(F,0);
59      double *S=p.row_jac->ReferenceElement->S;      double *S=p.row_jac->ReferenceElement->S;
60    
61    
62      #pragma omp parallel private(color)      #pragma omp parallel private(color,EM_S, EM_F, Vol, D_p, Y_p,row_index,q, s,r,k,m,rtmp, rtmp_D,add_EM_F, add_EM_S)
63      {      {
64         double EM_S[p.row_NN*p.col_NN*p.numEqu*p.numComp], EM_F[p.row_NN*p.numEqu];         EM_S=THREAD_MEMALLOC(p.row_NN*p.col_NN*p.numEqu*p.numComp,double);
65         index_t row_index[p.row_NN];         EM_F=THREAD_MEMALLOC(p.row_NN*p.numEqu,double);
66         register dim_t q, s,r,k,m;         row_index=THREAD_MEMALLOC(p.row_NN,index_t);
67         register double rtmp, rtmp_D;                                                                                                                                                                                                      
68         double *Vol, *D_p, *Y_p;         if (!Finley_checkPtr(EM_S) && !Finley_checkPtr(EM_F) && !Finley_checkPtr(row_index) ) {
69         bool_t add_EM_F, add_EM_S;  
70         #ifndef PASO_MPI            #ifndef PASO_MPI
71         for (color=elements->minColor;color<=elements->maxColor;color++) {            for (color=elements->minColor;color<=elements->maxColor;color++) {
72            /*  open loop over all elements: */               /*  open loop over all elements: */
73            #pragma omp for private(e) schedule(static)               #pragma omp for private(e) schedule(static)
74            for(e=0;e<elements->numElements;e++){               for(e=0;e<elements->numElements;e++){
75               if (elements->Color[e]==color) {                  if (elements->Color[e]==color) {
76         #else            #else
77         {            {
78            for(e=0;e<elements->numElements;e++) {               for(e=0;e<elements->numElements;e++) {
79               {                  {
80         #endif            #endif
81                  Vol=&(p.row_jac->volume[INDEX2(0,e,p.numQuad)]);                     Vol=&(p.row_jac->volume[INDEX2(0,e,p.numQuad)]);
82                  add_EM_F=FALSE;                     add_EM_F=FALSE;
83                  add_EM_S=FALSE;                     add_EM_S=FALSE;
84                  /************************************************************* */                     /************************************************************* */
85                  /* process D */                     /* process D */
86                  /**************************************************************/                     /**************************************************************/
87                  D_p=getSampleData(D,e);                     D_p=getSampleData(D,e);
88                  if (NULL!=D_p) {                     if (NULL!=D_p) {
89                    add_EM_S=TRUE;                       add_EM_S=TRUE;
90                    if (extendedD) {                       if (extendedD) {
91                        for (s=0;s<p.row_NS;s++) {                           for (s=0;s<p.row_NS;s++) {
92                          for (r=0;r<p.col_NS;r++) {                             for (r=0;r<p.col_NS;r++) {
93                            for (k=0;k<p.numEqu;k++) {                               for (k=0;k<p.numEqu;k++) {
94                              for (m=0;m<p.numComp;m++) {                                 for (m=0;m<p.numComp;m++) {
95                                     rtmp=0;
96                                     for (q=0;q<p.numQuad;q++) {
97                                        rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*D_p[INDEX3(k,m,q,p.numEqu,p.numComp)]*S[INDEX2(r,q,p.row_NS)];
98                                     }
99                                     EM_S[INDEX4(k,m,s         ,r         ,p.numEqu,p.numComp,p.row_NN)]= rtmp;
100                                     EM_S[INDEX4(k,m,s         ,r+p.col_NS,p.numEqu,p.numComp,p.row_NN)]=-rtmp;
101                                     EM_S[INDEX4(k,m,s+p.row_NS,r         ,p.numEqu,p.numComp,p.row_NN)]=-rtmp;
102                                     EM_S[INDEX4(k,m,s+p.row_NS,r+p.col_NS,p.numEqu,p.numComp,p.row_NN)]= rtmp;
103                                   }
104                                 }
105                               }
106                             }
107                         } else {
108                             for (s=0;s<p.row_NS;s++) {
109                               for (r=0;r<p.col_NS;r++) {
110                                   rtmp=0;
111                                   for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*S[INDEX2(r,q,p.row_NS)];
112                                   for (k=0;k<p.numEqu;k++) {
113                                       for (m=0;m<p.numComp;m++) {
114                                         rtmp_D=rtmp*D_p[INDEX2(k,m,p.numEqu)];
115                                         EM_S[INDEX4(k,m,s         ,r         ,p.numEqu,p.numComp,p.row_NN)]= rtmp_D;
116                                         EM_S[INDEX4(k,m,s         ,r+p.col_NS,p.numEqu,p.numComp,p.row_NN)]=-rtmp_D;
117                                         EM_S[INDEX4(k,m,s+p.row_NS,r         ,p.numEqu,p.numComp,p.row_NN)]=-rtmp_D;
118                                         EM_S[INDEX4(k,m,s+p.row_NS,r+p.col_NS,p.numEqu,p.numComp,p.row_NN)]= rtmp_D;
119                                      }
120                                   }
121                               }
122                             }
123                         }
124                       }
125                      /**************************************************************/
126                      /*   process Y: */
127                      /**************************************************************/
128                       Y_p=getSampleData(Y,e);
129                       if (NULL!=Y_p) {
130                         add_EM_F=TRUE;
131                         if (extendedY) {
132                            for (s=0;s<p.row_NS;s++) {
133                               for (k=0;k<p.numEqu;k++) {
134                                rtmp=0;                                rtmp=0;
135                                for (q=0;q<p.numQuad;q++) {                                for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*Y_p[INDEX2(k,q,p.numEqu)];
136                                   rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*D_p[INDEX3(k,m,q,p.numEqu,p.numComp)]*S[INDEX2(r,q,p.row_NS)];                                EM_F[INDEX2(k,s         ,p.numEqu)]=-rtmp;
137                                }                                EM_F[INDEX2(k,s+p.row_NS,p.numEqu)]= rtmp;
138                                EM_S[INDEX4(k,m,s         ,r         ,p.numEqu,p.numComp,p.row_NN)]= rtmp;                             }
                               EM_S[INDEX4(k,m,s         ,r+p.col_NS,p.numEqu,p.numComp,p.row_NN)]=-rtmp;  
                               EM_S[INDEX4(k,m,s+p.row_NS,r         ,p.numEqu,p.numComp,p.row_NN)]=-rtmp;  
                               EM_S[INDEX4(k,m,s+p.row_NS,r+p.col_NS,p.numEqu,p.numComp,p.row_NN)]= rtmp;  
                             }  
                           }  
139                          }                          }
140                        }                        } else {
141                    } else {                          for (s=0;s<p.row_NS;s++) {
                       for (s=0;s<p.row_NS;s++) {  
                         for (r=0;r<p.col_NS;r++) {  
142                              rtmp=0;                              rtmp=0;
143                              for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*S[INDEX2(r,q,p.row_NS)];                              for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)];
144                              for (k=0;k<p.numEqu;k++) {                              for (k=0;k<p.numEqu;k++) {
145                                  for (m=0;m<p.numComp;m++) {                                 rtmp_D=rtmp*Y_p[k];
146                                    rtmp_D=rtmp*D_p[INDEX2(k,m,p.numEqu)];                                 EM_F[INDEX2(k,s         ,p.numEqu)]=-rtmp_D;
147                                    EM_S[INDEX4(k,m,s         ,r         ,p.numEqu,p.numComp,p.row_NN)]= rtmp_D;                                 EM_F[INDEX2(k,s+p.row_NS,p.numEqu)]= rtmp_D;
                                   EM_S[INDEX4(k,m,s         ,r+p.col_NS,p.numEqu,p.numComp,p.row_NN)]=-rtmp_D;  
                                   EM_S[INDEX4(k,m,s+p.row_NS,r         ,p.numEqu,p.numComp,p.row_NN)]=-rtmp_D;  
                                   EM_S[INDEX4(k,m,s+p.row_NS,r+p.col_NS,p.numEqu,p.numComp,p.row_NN)]= rtmp_D;  
                                }  
148                              }                              }
149                          }                          }
150                        }                        }
151                    }                      }
152                  }                      /***********************************************************************************************/
153                 /**************************************************************/                      /* add the element matrices onto the matrix and right hand side                                */
154                 /*   process Y: */                      /***********************************************************************************************/
155                 /**************************************************************/                      for (q=0;q<p.row_NN;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[q],e,p.row_NN)]];
156                  Y_p=getSampleData(Y,e);                      if (add_EM_F) Finley_Util_AddScatter(p.row_NN,row_index,p.numEqu,EM_F,F_p, p.row_DOF_UpperBound);
157                  if (NULL!=Y_p) {                      if (add_EM_S) Finley_Assemble_addToSystemMatrix(Mat,p.row_NN,row_index,p.numEqu,p.col_NN,row_index,p.numComp,EM_S);
158                    add_EM_F=TRUE;    
159                    if (extendedY) {                  } /* end color check */
160                       for (s=0;s<p.row_NS;s++) {               } /* end element loop */
161                          for (k=0;k<p.numEqu;k++) {           } /* end color loop */
162                             rtmp=0;            
163                             for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*Y_p[INDEX2(k,q,p.numEqu)];           THREAD_MEMFREE(EM_S);
164                             EM_F[INDEX2(k,s         ,p.numEqu)]=-rtmp;           THREAD_MEMFREE(EM_F);
165                             EM_F[INDEX2(k,s+p.row_NS,p.numEqu)]= rtmp;           THREAD_MEMFREE(row_index);
166                          }  
167                       }        } /* end of pointer check */
                    } else {  
                      for (s=0;s<p.row_NS;s++) {  
                          rtmp=0;  
                          for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)];  
                          for (k=0;k<p.numEqu;k++) {  
                             rtmp_D=rtmp*Y_p[k];  
                             EM_F[INDEX2(k,s         ,p.numEqu)]=-rtmp_D;  
                             EM_F[INDEX2(k,s+p.row_NS,p.numEqu)]= rtmp_D;  
                          }  
                      }  
                    }  
                  }  
                  /***********************************************************************************************/  
                  /* add the element matrices onto the matrix and right hand side                                */  
                  /***********************************************************************************************/  
                  for (q=0;q<p.row_NN;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[q],e,p.row_NN)]];  
                  if (add_EM_F) Finley_Util_AddScatter(p.row_NN,row_index,p.numEqu,EM_F,F_p, p.row_DOF_UpperBound);  
                  if (add_EM_S) Finley_Assemble_addToSystemMatrix(Mat,p.row_NN,row_index,p.numEqu,p.col_NN,row_index,p.numComp,EM_S);  
   
              } /* end color check */  
           } /* end element loop */  
       } /* end color loop */  
168     } /* end parallel region */     } /* end parallel region */
169  }  }
170  /*  /*

Legend:
Removed from v.852  
changed lines
  Added in v.853

  ViewVC Help
Powered by ViewVC 1.1.26