/[escript]/trunk/finley/src/Assemble_LumpedSystem.c
ViewVC logotype

Diff of /trunk/finley/src/Assemble_LumpedSystem.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

trunk/esys2/finley/src/finleyC/Assemble_PDE.c revision 100 by jgs, Wed Dec 15 03:48:48 2004 UTC trunk/finley/src/Assemble_LumpedSystem.c revision 1220 by btully, Thu Aug 2 04:46:20 2007 UTC
# Line 1  Line 1 
1  /* $Id$ */  /*
2     ************************************************************
3  /**************************************************************/   *          Copyright 2006,2007 by ACcENULLNULL MNRF              *
4     *                                                          *
5  /*    assembles the system of numEq PDEs into the stiffness matrix S and right hand side F */   *              http://www.access.edu.au                    *
6     *       Primary Business: Queensland, Australia            *
7  /*     -div(A*grad u)-div(B*u)+C*grad u + D*u= -div X + Y */   *  Licensed under the Open NULLoftware License version 3.0    *
8     *     http://www.opensource.org/licenses/osl-3.0.php       *
9  /*      -(A_{k,i,m,j} u_m,j)_i-(B_{k,i,m} u_m)_i+C_{k,m,j} u_m,j-D_{k,m} u_m = -(X_{k,i})_i + Y_k */   *                                                          *
10     ************************************************************
11  /*    u has numComp components. */  */
12    
 /*    Shape of the coefficients: */  
13    
14  /*      A = numEqu x numDim x numComp x numDim */  /**************************************************************/
 /*      B = numDim x numEqu x numComp  */  
 /*      C = numEqu x numDim x numComp  */  
 /*      D = numEqu x numComp  */  
 /*      X = numEqu x numDim   */  
 /*      Y = numEqu */  
15    
16  /*    The coefficients A,B,C,D,X and Y have to be defined on the integartion points or not present (=NULL). */  /*    assembles the mass matrix in lumped form                */
17    
18  /*    S and F have to be initialized before the routine is called. S or F can be NULL. In this case the left or */  /*    The coefficient D has to be defined on the integration points or not present. */
 /*    the right hand side of the PDE is not processed.  */  
19    
20  /*    The routine does not consider any boundary conditions. */  /*    lumpedMat has to be initialized before the routine is called. */
21    
22  /**************************************************************/  /**************************************************************/
23    
24  /*   Copyrights by ACcESS Australia, 2003,2004 */  /*  Author: gross@access.edu.au */
25  /*   author: gross@access.edu.au */  /*  Version: $Id$ */
 /*   Version: $Id$ */  
26    
27  /**************************************************************/  /**************************************************************/
28    
 #include "escript/Data/DataC.h"  
 #include "Finley.h"  
29  #include "Assemble.h"  #include "Assemble.h"
 #include "NodeFile.h"  
 #include "ElementFile.h"  
30  #include "Util.h"  #include "Util.h"
31  #ifdef _OPENMP  #ifdef _OPENMP
32  #include <omp.h>  #include <omp.h>
33  #endif  #endif
34    
35    
36    #define NEW_LUMPING /* */
37    
38  /**************************************************************/  /**************************************************************/
39    
40  void Finley_Assemble_PDE(Finley_NodeFile* nodes,Finley_ElementFile* elements,Finley_SystemMatrix* S, escriptDataC* F,  void Finley_Assemble_LumpedSystem(Finley_NodeFile* nodes,Finley_ElementFile* elements, escriptDataC* lumpedMat, escriptDataC* D)
41               escriptDataC* A, escriptDataC* B, escriptDataC* C, escriptDataC* D, escriptDataC* X, escriptDataC* Y ) {  {
42    
43    double *EM_S=NULL,*EM_F=NULL,*V=NULL,*dVdv=NULL,*dSdV=NULL,*Vol=NULL,*dvdV=NULL;    bool_t reducedIntegrationOrder=FALSE, expandedD;
44    double time0;    char error_msg[LenErrorMsg_MAX];
   int dimensions[ESCRIPT_MAX_DATA_RANK],e,q,color;  
45    Assemble_Parameters p;    Assemble_Parameters p;
46    maybelong *index_row=NULL,*index_col=NULL;    double time0;
47      dim_t dimensions[ESCRIPT_MAX_DATA_RANK], k, e, len_EM_lumpedMat, q, s;
48    if (nodes==NULL || elements==NULL) return;    type_t funcspace;
49    if (S==NULL && isEmpty(F)) return;    index_t color,*row_index=NULL;
50      double *S=NULL, *EM_lumpedMat=NULL, *Vol=NULL, *D_p=NULL, *lumpedMat_p=NULL;
51    /* set all parameters in p*/    register double rtmp, m_t, diagS;
52    Assemble_getAssembleParameters(nodes,elements,S,F,&p);    size_t len_EM_lumpedMat_size;
   if (Finley_ErrorCode!=NO_ERROR) return;  
   
   /*  this function assumes NS=NN */  
   if (p.NN!=p.NS) {  
     Finley_ErrorCode=SYSTEM_ERROR;  
     sprintf(Finley_ErrorMsg,"for Finley_Assemble_PDE numNodes and numShapes have to be identical.");  
     return;  
   }  
   if (p.numDim!=p.numElementDim) {  
     Finley_ErrorCode=SYSTEM_ERROR;  
     sprintf(Finley_ErrorMsg,"Finley_Assemble_PDE accepts volume elements only.");  
     return;  
   }  
   /*  get a functionspace */  
   int funcspace=UNKNOWN;  
   updateFunctionSpaceType(funcspace,A);  
   updateFunctionSpaceType(funcspace,B);  
   updateFunctionSpaceType(funcspace,C);  
   updateFunctionSpaceType(funcspace,D);  
   updateFunctionSpaceType(funcspace,X);  
   updateFunctionSpaceType(funcspace,Y);  
   if (funcspace==UNKNOWN) return; /* all  data are empty */  
53    
54    /* check if all function spaces are the same */    Finley_resetError();
55    
56    if (! functionSpaceTypeEqual(funcspace,A) ) {    if (nodes==NULL || elements==NULL) return;
57          Finley_ErrorCode=TYPE_ERROR;    if (isEmpty(lumpedMat) || isEmpty(D)) return;
58          sprintf(Finley_ErrorMsg,"unexpected function space typ for coefficient A");    if (isEmpty(lumpedMat) && !isEmpty(D)) {
59    }          Finley_setError(TYPE_ERROR,"Assemble_LumpedSystem: coefficients are non-zero but no lumped matrix is given.");
60    if (! functionSpaceTypeEqual(funcspace,B) ) {          return;
         Finley_ErrorCode=TYPE_ERROR;  
         sprintf(Finley_ErrorMsg,"unexpected function space typ for coefficient B");  
   }  
   if (! functionSpaceTypeEqual(funcspace,C) ) {  
         Finley_ErrorCode=TYPE_ERROR;  
         sprintf(Finley_ErrorMsg,"unexpected function space typ for coefficient C");  
   }  
   if (! functionSpaceTypeEqual(funcspace,D) ) {  
         Finley_ErrorCode=TYPE_ERROR;  
         sprintf(Finley_ErrorMsg,"unexpected function space typ for coefficient D");  
   }  
   if (! functionSpaceTypeEqual(funcspace,X) ) {  
         Finley_ErrorCode=TYPE_ERROR;  
         sprintf(Finley_ErrorMsg,"unexpected function space typ for coefficient X");  
   }  
   if (! functionSpaceTypeEqual(funcspace,Y) ) {  
         Finley_ErrorCode=TYPE_ERROR;  
         sprintf(Finley_ErrorMsg,"unexpected function space typ for coefficient Y");  
61    }    }
62      funcspace=getFunctionSpaceType(D);
63    /* check if all function spaces are the same */    /* check if all function spaces are the same */
64      if (funcspace==FINLEY_ELEMENTS) {
65    if (! numSamplesEqual(A,p.numQuad,elements->numElements) ) {         reducedIntegrationOrder=FALSE;
66          Finley_ErrorCode=TYPE_ERROR;    } else if (funcspace==FINLEY_FACE_ELEMENTS)  {
67          sprintf(Finley_ErrorMsg,"sample points of coefficient A don't match (%d,%d)",p.numQuad,elements->numElements);         reducedIntegrationOrder=FALSE;
68      } else if (funcspace==FINLEY_REDUCED_ELEMENTS) {
69           reducedIntegrationOrder=TRUE;
70      } else if (funcspace==FINLEY_REDUCED_FACE_ELEMENTS)  {
71           reducedIntegrationOrder=TRUE;
72      } else {
73           Finley_setError(TYPE_ERROR,"Assemble_LumpedSystem: assemblage failed because of illegal function space.");
74    }    }
75      if (! Finley_noError()) return;
76    
77    if (! numSamplesEqual(B,p.numQuad,elements->numElements) ) {    /* set all parameters in p*/
78          Finley_ErrorCode=TYPE_ERROR;    Assemble_getAssembleParameters(nodes,elements,NULL,lumpedMat, reducedIntegrationOrder, &p);
79          sprintf(Finley_ErrorMsg,"sample points of coefficient B don't match (%d,%d)",p.numQuad,elements->numElements);    if (! Finley_noError()) return;
   }  
80    
81    if (! numSamplesEqual(C,p.numQuad,elements->numElements) ) {    /* check if all function spaces are the same */
         Finley_ErrorCode=TYPE_ERROR;  
         sprintf(Finley_ErrorMsg,"sample points of coefficient C don't match (%d,%d)",p.numQuad,elements->numElements);  
   }  
82    
83    if (! numSamplesEqual(D,p.numQuad,elements->numElements) ) {    if (! numSamplesEqual(D,p.numQuad,elements->numElements) ) {
84          Finley_ErrorCode=TYPE_ERROR;          sprintf(error_msg,"Assemble_LumpedSystem: sample points of coefficient D don't match (%d,%d)",p.numQuad,elements->numElements);
85          sprintf(Finley_ErrorMsg,"sample points of coefficient D don't match (%d,%d)",p.numQuad,elements->numElements);          Finley_setError(TYPE_ERROR,error_msg);
   }  
   
   if (! numSamplesEqual(X,p.numQuad,elements->numElements) ) {  
         Finley_ErrorCode=TYPE_ERROR;  
         sprintf(Finley_ErrorMsg,"sample points of coefficient X don't match (%d,%d)",p.numQuad,elements->numElements);  
   }  
   
   if (! numSamplesEqual(Y,p.numQuad,elements->numElements) ) {  
         Finley_ErrorCode=TYPE_ERROR;  
         sprintf(Finley_ErrorMsg,"sample points of coefficient Y don't match (%d,%d)",p.numQuad,elements->numElements);  
86    }    }
87    
88    /*  check the dimensions: */    /*  check the dimensions: */
89        
90    if (p.numEqu==1 && p.numComp==1) {    if (p.numEqu==1) {
     if (!isEmpty(A)) {  
       dimensions[0]=p.numDim;  
       dimensions[1]=p.numDim;  
       if (!isDataPointShapeEqual(A,2,dimensions)) {  
           Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient A: illegal shape, expected shape (%d,%d)",dimensions[0],dimensions[1]);  
       }  
     }  
     if (!isEmpty(B)) {  
        dimensions[0]=p.numDim;  
        if (!isDataPointShapeEqual(B,1,dimensions)) {  
           Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient B: illegal shape (%d,)",dimensions[0]);  
        }  
     }  
     if (!isEmpty(C)) {  
        dimensions[0]=p.numDim;  
        if (!isDataPointShapeEqual(C,1,dimensions)) {  
           Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient C, expected shape (%d,)",dimensions[0]);  
        }  
     }  
91      if (!isEmpty(D)) {      if (!isEmpty(D)) {
92         if (!isDataPointShapeEqual(D,0,dimensions)) {         if (!isDataPointShapeEqual(D,0,dimensions)) {
93            Finley_ErrorCode=TYPE_ERROR;            Finley_setError(TYPE_ERROR,"Assemble_LumpedSystem: coefficient D, rank 0 expected.");
           sprintf(Finley_ErrorMsg,"coefficient D, rank 0 expected.");  
        }  
     }  
     if (!isEmpty(X)) {  
        dimensions[0]=p.numDim;  
        if (!isDataPointShapeEqual(X,1,dimensions)) {  
           Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient X, expected shape (%d,",dimensions[0]);  
94         }         }
95    
96      }      }
     if (!isEmpty(Y)) {  
        if (!isDataPointShapeEqual(Y,0,dimensions)) {  
           Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient Y, rank 0 expected.");  
        }  
     }  
97    } else {    } else {
     if (!isEmpty(A)) {  
       dimensions[0]=p.numEqu;  
       dimensions[1]=p.numDim;  
       dimensions[2]=p.numComp;  
       dimensions[3]=p.numDim;  
       if (!isDataPointShapeEqual(A,4,dimensions)) {  
           Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient A, expected shape (%d,%d,%d,%d)",dimensions[0],dimensions[1],dimensions[2],dimensions[3]);  
       }  
     }  
     if (!isEmpty(B)) {  
       dimensions[0]=p.numEqu;  
       dimensions[1]=p.numDim;  
       dimensions[2]=p.numComp;  
       if (!isDataPointShapeEqual(B,3,dimensions)) {  
           Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient B, expected shape (%d,%d,%d)",dimensions[0],dimensions[1],dimensions[2]);  
       }  
     }  
     if (!isEmpty(C)) {  
       dimensions[0]=p.numEqu;  
       dimensions[1]=p.numComp;  
       dimensions[2]=p.numDim;  
       if (!isDataPointShapeEqual(C,3,dimensions)) {  
            Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient C, expected shape (%d,%d,%d)",dimensions[0],dimensions[1],dimensions[2]);  
       }  
     }  
98      if (!isEmpty(D)) {      if (!isEmpty(D)) {
99        dimensions[0]=p.numEqu;        dimensions[0]=p.numEqu;
100        dimensions[1]=p.numComp;        if (!isDataPointShapeEqual(D,1,dimensions)) {
101        if (!isDataPointShapeEqual(D,2,dimensions)) {            sprintf(error_msg,"Assemble_LumpedSystem: coefficient D, expected shape (%d,)",dimensions[0]);
102            Finley_ErrorCode=TYPE_ERROR;            Finley_setError(TYPE_ERROR,error_msg);
           sprintf(Finley_ErrorMsg,"coefficient D, expected shape (%d,%d)",dimensions[0],dimensions[1]);  
       }  
     }  
     if (!isEmpty(X)) {  
       dimensions[0]=p.numEqu;  
       dimensions[1]=p.numDim;  
       if (!isDataPointShapeEqual(X,2,dimensions)) {  
            Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient X, expected shape (%d,%d)",dimensions[0],dimensions[1]);  
       }  
     }  
     if (!isEmpty(Y)) {  
       dimensions[0]=p.numEqu;  
       if (!isDataPointShapeEqual(Y,1,dimensions)) {  
            Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient Y, expected shape (%d,)",dimensions[0]);  
103        }        }
104      }      }
105    }    }
106    
107    if (Finley_ErrorCode==NO_ERROR) {    if (Finley_noError()) {
108       time0=Finley_timer();      lumpedMat_p=getSampleData(lumpedMat,0);
109       #pragma omp parallel private(index_col,index_row,EM_S,EM_F,V,dVdv,dSdV,Vol,dvdV,color,q) \      len_EM_lumpedMat=p.row_NN*p.numEqu;
110              firstprivate(elements,nodes,S,F,A,B,C,D,X,Y)      len_EM_lumpedMat_size=len_EM_lumpedMat*sizeof(double);
111       {      expandedD=isExpanded(D);
112           EM_S=EM_F=V=dVdv=dSdV=Vol=dvdV=NULL;      S=p.row_jac->ReferenceElement->S;
113           index_row=index_col=NULL;  
114        #pragma omp parallel private(color, EM_lumpedMat, row_index, Vol, D_p, s, q, k, rtmp, m_t, diagS)
115           /* allocate work arrays: */      {
116           EM_lumpedMat=THREAD_MEMALLOC(len_EM_lumpedMat,double);
117           EM_S=(double*) THREAD_MEMALLOC(p.NN_row*p.NN_col*p.numEqu*p.numComp*sizeof(double));         row_index=THREAD_MEMALLOC(p.row_NN,index_t);
118           EM_F=(double*) THREAD_MEMALLOC(p.NN_row*p.numEqu*sizeof(double));         if ( !Finley_checkPtr(EM_lumpedMat) && !Finley_checkPtr(row_index) ) {
119           V=(double*) THREAD_MEMALLOC(p.NN*p.numDim*sizeof(double));            if (p.numEqu == 1) {
120           dVdv=(double*) THREAD_MEMALLOC(p.numDim*p.numDim*p.numQuad*sizeof(double));               if (expandedD) {
121           dvdV=(double*) THREAD_MEMALLOC(p.numDim*p.numDim*p.numQuad*sizeof(double));                   #ifndef PASO_MPI
122           dSdV=(double*) THREAD_MEMALLOC(p.NS_row*p.numQuad*p.numDim*sizeof(double));                   for (color=elements->minColor;color<=elements->maxColor;color++) {
123           Vol=(double*) THREAD_MEMALLOC(p.numQuad*sizeof(double));                      /*  open loop over all elements: */
124           index_col=(maybelong*) THREAD_MEMALLOC(p.NN_col*sizeof(maybelong));                      #pragma omp for private(e) schedule(static)
125           index_row=(maybelong*) THREAD_MEMALLOC(p.NN_row*sizeof(maybelong));                      for(e=0;e<elements->numElements;e++){
126                           if (elements->Color[e]==color) {
127           if (! (Finley_checkPtr(EM_S) || Finley_checkPtr(EM_F) || Finley_checkPtr(V) || Finley_checkPtr(index_col) ||                   #else
128                  Finley_checkPtr(index_row) || Finley_checkPtr(dVdv) || Finley_checkPtr(dSdV) || Finley_checkPtr(Vol) ))  {                   {
129                        for(e=0;e<elements->numElements;e++) {
130             /*  open loop over all colors: */                         {
131             for (color=0;color<elements->numColors;color++) {                   #endif
132                /*  open loop over all elements: */                            Vol=&(p.row_jac->volume[INDEX2(0,e,p.numQuad)]);
133                #pragma omp for private(e) schedule(static)                            memset(EM_lumpedMat,0,len_EM_lumpedMat_size);
134                for(e=0;e<elements->numElements;e++){                            D_p=getSampleData(D,e);
135                  if (elements->Color[e]==color) {                            #ifdef NEW_LUMPING /* HRZ lumping */
136                    for (q=0;q<p.NN_row;q++) index_row[q]=p.label_row[elements->Nodes[INDEX2(p.row_node[q],e,p.NN)]];                            /*
137                    /* gather V-coordinates of nodes into V: */                             *           Number of PDEs: 1
138            Finley_Util_Gather_double(p.NN,&(elements->Nodes[INDEX2(0,e,p.NN)]),p.numDim,nodes->Coordinates,V);                             *  D_p varies over element: True
139                    /*  calculate dVdv(i,j,q)=V(i,k)*DSDv(k,j,q) */                             */
140            Finley_Util_SmallMatMult(p.numDim,p.numDim*p.numQuad,dVdv,p.NS,V,p.referenceElement->dSdv);                            m_t=0; /* mass of the element: m_t */
141                    /*  dvdV=invert(dVdv) inplace */                            for (q=0;q<p.numQuad;q++) {
142            Finley_Util_InvertSmallMat(p.numQuad,p.numDim,dVdv,dvdV,Vol);                                m_t+=Vol[q]*D_p[q];
143                    /*  calculate dSdV=DSDv*DvDV */                            }                          
144            Finley_Util_SmallMatSetMult(p.numQuad,p.NS_row,p.numDim,dSdV,p.numDim,p.referenceElement_row->dSdv,dvdV);                            diagS=0; /* diagonal sum: S */
145                    /*  scale volume: */                            for (s=0;s<p.row_NS;s++) {
146            for (q=0;q<p.numQuad;q++) Vol[q]=ABS(Vol[q]*p.referenceElement->QuadWeights[q]);                                rtmp=0;
147                                      for (q=0;q<p.numQuad;q++) {
148                     /*   integration for the stiffness matrix: */                                    rtmp+=Vol[q]*D_p[q]*S[INDEX2(s,q,p.row_NS)]*S[INDEX2(s,q,p.row_NS)];
149                     /*   in order to optimze the number of operations the case of constants coefficience needs a bit more work */                                }
150                     /*   to make use of some symmetry. */                                EM_lumpedMat[INDEX2(0,s,p.numEqu)]+=rtmp;
151                                  diagS+=EM_lumpedMat[INDEX2(0,s,p.numEqu)];
152                       if (S!=NULL) {                            }
153                         for (q=0;q<p.NN_row*p.NN_col*p.numEqu*p.numComp;q++) EM_S[q]=0;                            /* rescale diagonals by m_t/diagS to ensure consistent mass over element */
154                         if (p.numEqu==1 && p.numComp==1) {                            for (s=0;s<p.row_NS;s++) {
155                         Finley_Assemble_PDEMatrix_Single2(p.NS_row,p.numDim,p.numQuad,                                EM_lumpedMat[INDEX2(0,s,p.numEqu)]*=m_t/diagS;
156                                                                       p.referenceElement_row->S,dSdV,Vol,p.NN_row,EM_S,                            }
157                                                                       getSampleData(A,e),isExpanded(A),                            #else /* row-sum lumping */
158                                                                       getSampleData(B,e),isExpanded(B),                            for (s=0;s<p.row_NS;s++) {
159                                                                       getSampleData(C,e),isExpanded(C),                                rtmp=0;
160                                                                       getSampleData(D,e),isExpanded(D));                                for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*D_p[q];
161                         } else {                                EM_lumpedMat[INDEX2(0,s,p.numEqu)]+=rtmp;
162                         Finley_Assemble_PDEMatrix_System2(p.NS_row,p.numDim,p.numQuad,p.numEqu,p.numComp,                            }
163                                                                       p.referenceElement_row->S,dSdV,Vol,p.NN_row,EM_S,                            #endif
164                                                                       getSampleData(A,e),isExpanded(A),                            for (q=0;q<p.row_NN;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[q],e,p.NN)]];
165                                                                       getSampleData(B,e),isExpanded(B),                            Finley_Util_AddScatter(p.row_NN,row_index,p.numEqu,EM_lumpedMat,lumpedMat_p, p.row_DOF_UpperBound);
166                                                                       getSampleData(C,e),isExpanded(C),                         } /* end color check */
167                                                                       getSampleData(D,e),isExpanded(D));                      } /* end element loop */
168                         }                    } /* end color loop */
169                         for (q=0;q<p.NN_col;q++) index_col[q]=p.label_col[elements->Nodes[INDEX2(p.col_node[q],e,p.NN)]];               } else  {
170                         Finley_SystemMatrix_add(S,p.NN_row,index_row,p.numEqu,p.NN_col,index_col,p.numComp,EM_S);                   #ifndef PASO_MPI
171                       }                   for (color=elements->minColor;color<=elements->maxColor;color++) {
172                       if (!isEmpty(F)) {                   /*  open loop over all elements: */
173                         for (q=0;q<p.NN_row*p.numEqu;q++) EM_F[q]=0;                   #pragma omp for private(e) schedule(static)
174                         if (p.numEqu==1) {                   for(e=0;e<elements->numElements;e++){
175                         Finley_Assemble_RHSMatrix_Single(p.NS_row,p.numDim,p.numQuad,                      if (elements->Color[e]==color) {
176                                                                   p.referenceElement_row->S,dSdV,Vol,p.NN_row,EM_F,                   #else
177                                                                   getSampleData(X,e),isExpanded(X),                   {
178                                                                   getSampleData(Y,e),isExpanded(Y));                      for(e=0;e<elements->numElements;e++) {
179                         } else {                         {
180                         Finley_Assemble_RHSMatrix_System(p.NS_row,p.numDim,p.numQuad,                   #endif
181                                                                   p.numEqu,p.referenceElement_row->S,dSdV,Vol,p.NN_row,EM_F,                            Vol=&(p.row_jac->volume[INDEX2(0,e,p.numQuad)]);
182                                                                   getSampleData(X,e),isExpanded(X),                            memset(EM_lumpedMat,0,len_EM_lumpedMat_size);
183                                                                   getSampleData(Y,e),isExpanded(Y));                            D_p=getSampleData(D,e);
184                         }                            #ifdef NEW_LUMPING /* HRZ lumping */
185                         /* add  */                            /*
186                         Finley_Util_AddScatter(p.NN_row,index_row,p.numEqu,EM_F,getSampleData(F,0));                             *           Number of PDEs: 1
187                      }                             *  D_p varies over element: False
188                  }                             */
189                }                            m_t=0; /* mass of the element: m_t */
190              }                            for (q=0;q<p.numQuad;q++) {
191           }                                m_t+=Vol[q]*D_p[0];
192           /* clean up */                            }                          
193           THREAD_MEMFREE(EM_S);                            diagS=0; /* diagonal sum: S */
194           THREAD_MEMFREE(EM_F);                            for (s=0;s<p.row_NS;s++) {
195           THREAD_MEMFREE(V);                                rtmp=0;
196           THREAD_MEMFREE(dVdv);                                for (q=0;q<p.numQuad;q++) {
197           THREAD_MEMFREE(dvdV);                                    rtmp+=Vol[q]*D_p[0]*S[INDEX2(s,q,p.row_NS)]*S[INDEX2(s,q,p.row_NS)];
198           THREAD_MEMFREE(dSdV);                                }
199           THREAD_MEMFREE(Vol);                                EM_lumpedMat[INDEX2(0,s,p.numEqu)]+=rtmp;
200           THREAD_MEMFREE(index_col);                                diagS+=EM_lumpedMat[INDEX2(0,s,p.numEqu)];
201           THREAD_MEMFREE(index_row);                            }
202       }                            /* rescale diagonals by m_t/diagS to ensure consistent mass over element */
203       printf("timing: assemblage PDE: %.4e sec\n",Finley_timer()-time0);                            for (s=0;s<p.row_NS;s++) {
204    }                                EM_lumpedMat[INDEX2(0,s,p.numEqu)]*=m_t/diagS;
205                              }
206                              #else /* row-sum lumping */
207                              for (s=0;s<p.row_NS;s++) {
208                                  rtmp=0;
209                                  for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)];
210                                  EM_lumpedMat[INDEX2(0,s,p.numEqu)]+=rtmp*D_p[0];
211                              }
212                              #endif
213                              for (q=0;q<p.row_NN;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[q],e,p.NN)]];
214                              Finley_Util_AddScatter(p.row_NN,row_index,p.numEqu,EM_lumpedMat,lumpedMat_p, p.row_DOF_UpperBound);
215                          } /* end color check */
216                        } /* end element loop */
217                     } /* end color loop */
218                 }
219              } else {
220                 if (expandedD) {
221                     #ifndef PASO_MPI
222                     for (color=elements->minColor;color<=elements->maxColor;color++) {
223                        /*  open loop over all elements: */
224                        #pragma omp for private(e) schedule(static)
225                        for(e=0;e<elements->numElements;e++){
226                           if (elements->Color[e]==color) {
227                     #else
228                     {
229                        for(e=0;e<elements->numElements;e++) {
230                           {
231                     #endif
232                              Vol=&(p.row_jac->volume[INDEX2(0,e,p.numQuad)]);
233                              memset(EM_lumpedMat,0,len_EM_lumpedMat_size);
234                              D_p=getSampleData(D,e);
235                              #ifdef NEW_LUMPING /* HRZ lumping */
236                              /*
237                               *           Number of PDEs: Multiple
238                               *  D_p varies over element: True
239                               */
240                              for (k=0;k<p.numEqu;k++) {
241                                  m_t=0; /* mass of the element: m_t */
242                                  for (q=0;q<p.numQuad;q++) {
243                                      m_t+=Vol[q]*D_p[INDEX2(k,q,p.numEqu)];
244                                  }                          
245                                  diagS=0; /* diagonal sum: S */
246                                  for (s=0;s<p.row_NS;s++) {
247                                      rtmp=0;
248                                      for (q=0;q<p.numQuad;q++) {
249                                          rtmp+=Vol[q]*D_p[INDEX2(k,q,p.numEqu)]*S[INDEX2(s,q,p.row_NS)]*S[INDEX2(s,q,p.row_NS)];
250                                      }
251                                      EM_lumpedMat[INDEX2(k,s,p.numEqu)]+=rtmp;
252                                      diagS+=EM_lumpedMat[INDEX2(k,s,p.numEqu)];
253                                  }
254                                  /* rescale diagonals by m_t/diagS to ensure consistent mass over element */
255                                  for (s=0;s<p.row_NS;s++) {
256                                      EM_lumpedMat[INDEX2(k,s,p.numEqu)]*=m_t/diagS;
257                                  }
258                              }
259                              #else /* row-sum lumping */
260                              for (s=0;s<p.row_NS;s++) {
261                                  for (k=0;k<p.numEqu;k++) {
262                                      rtmp=0.;
263                                      for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*D_p[INDEX2(k,q,p.numEqu)];
264                                      EM_lumpedMat[INDEX2(k,s,p.numEqu)]+=rtmp;
265                                  }
266                              }
267                              #endif
268                              for (q=0;q<p.row_NN;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[q],e,p.NN)]];
269                              Finley_Util_AddScatter(p.row_NN,row_index,p.numEqu,EM_lumpedMat,lumpedMat_p, p.row_DOF_UpperBound);
270                           } /* end color check */
271                        } /* end element loop */
272                    } /* end color loop */
273                 } else {
274                     #ifndef PASO_MPI
275                     for (color=elements->minColor;color<=elements->maxColor;color++) {
276                        /*  open loop over all elements: */
277                        #pragma omp for private(e) schedule(static)
278                        for(e=0;e<elements->numElements;e++){
279                           if (elements->Color[e]==color) {
280                     #else
281                     {
282                        for(e=0;e<elements->numElements;e++) {
283                           {
284                     #endif
285                              Vol=&(p.row_jac->volume[INDEX2(0,e,p.numQuad)]);
286                              memset(EM_lumpedMat,0,len_EM_lumpedMat_size);
287                              D_p=getSampleData(D,e);
288                              #ifdef NEW_LUMPING /* HRZ lumping */
289                              /*
290                               *           Number of PDEs: Multiple
291                               *  D_p varies over element: False
292                               */
293                              for (k=0;k<p.numEqu;k++) {
294                                  m_t=0; /* mass of the element: m_t */
295                                  for (q=0;q<p.numQuad;q++) {
296                                      m_t+=Vol[q]*D_p[k];
297                                  }                          
298                                  diagS=0; /* diagonal sum: S */
299                                  for (s=0;s<p.row_NS;s++) {
300                                      rtmp=0;
301                                      for (q=0;q<p.numQuad;q++) {
302                                          rtmp+=Vol[q]*D_p[k]*S[INDEX2(s,q,p.row_NS)]*S[INDEX2(s,q,p.row_NS)];
303                                      }
304                                      EM_lumpedMat[INDEX2(k,s,p.numEqu)]+=rtmp;
305                                      diagS+=EM_lumpedMat[INDEX2(k,s,p.numEqu)];
306                                  }
307                                  /* rescale diagonals by m_t/diagS to ensure consistent mass over element */
308                                  for (s=0;s<p.row_NS;s++) {
309                                      EM_lumpedMat[INDEX2(k,s,p.numEqu)]*=m_t/diagS;
310                                  }
311                              }
312                              #else /* row-sum lumping */
313                              for (s=0;s<p.row_NS;s++) {
314                                  rtmp=0;
315                                  for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)];
316                                  for (k=0;k<p.numEqu;k++) EM_lumpedMat[INDEX2(k,s,p.numEqu)]+=rtmp*D_p[k];
317                              }
318                              #endif
319                              for (q=0;q<p.row_NN;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[q],e,p.NN)]];
320                              Finley_Util_AddScatter(p.row_NN,row_index,p.numEqu,EM_lumpedMat,lumpedMat_p, p.row_DOF_UpperBound);
321                           } /* end color check */
322                        } /* end element loop */
323                    } /* end color loop */
324                 }
325              }
326           } /* end of pointer check */
327           THREAD_MEMFREE(EM_lumpedMat);
328           THREAD_MEMFREE(row_index);
329        } /* end parallel region */
330      }
331      #ifdef Finley_TRACE
332      printf("timing: assemblage lumped PDE: %.4e sec\n",Finley_timer()-time0);
333      #endif
334  }  }
 /*  
  * $Log$  
  * Revision 1.3  2004/12/15 03:48:44  jgs  
  * *** empty log message ***  
  *  
  * Revision 1.1.1.1  2004/10/26 06:53:57  jgs  
  * initial import of project esys2  
  *  
  * Revision 1.3  2004/07/30 04:37:06  gross  
  * escript and finley are linking now and RecMeshTest.py has been passed  
  *  
  * Revision 1.2  2004/07/21 05:00:54  gross  
  * name changes in DataC  
  *  
  * Revision 1.1  2004/07/02 04:21:13  gross  
  * Finley C code has been included  
  *  
  *  
  */  

Legend:
Removed from v.100  
changed lines
  Added in v.1220

  ViewVC Help
Powered by ViewVC 1.1.26