/[escript]/trunk/finley/src/Assemble_LumpedSystem.c
ViewVC logotype

Diff of /trunk/finley/src/Assemble_LumpedSystem.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

trunk/esys2/finley/src/finleyC/Assemble_PDE.c revision 97 by jgs, Tue Dec 14 05:39:33 2004 UTC trunk/finley/src/Assemble_LumpedSystem.c revision 3379 by gross, Wed Nov 24 04:48:49 2010 UTC
# Line 1  Line 1 
 /* $Id$ */  
1    
2  /**************************************************************/  /*******************************************************
3    *
4  /*    assembles the system of numEq PDEs into the stiffness matrix S and right hand side F */  * Copyright (c) 2003-2010 by University of Queensland
5    * Earth Systems Science Computational Center (ESSCC)
6  /*     -div(A*grad u)-div(B*u)+C*grad u + D*u= -div X + Y */  * http://www.uq.edu.au/esscc
7    *
8  /*      -(A_{k,i,m,j} u_m,j)_i-(B_{k,i,m} u_m)_i+C_{k,m,j} u_m,j-D_{k,m} u_m = -(X_{k,i})_i + Y_k */  * Primary Business: Queensland, Australia
9    * Licensed under the Open Software License version 3.0
10    * http://www.opensource.org/licenses/osl-3.0.php
11    *
12    *******************************************************/
13    
 /*    u has numComp components. */  
14    
15  /*    Shape of the coefficients: */  /**************************************************************/
   
 /*      A = numEqu x numDim x numComp x numDim */  
 /*      B = numDim x numEqu x numComp  */  
 /*      C = numEqu x numDim x numComp  */  
 /*      D = numEqu x numComp  */  
 /*      X = numEqu x numDim   */  
 /*      Y = numEqu */  
16    
17  /*    The coefficients A,B,C,D,X and Y have to be defined on the integartion points or not present (=NULL). */  /*    assembles the mass matrix in lumped form                */
18    
19  /*    S and F have to be initialized before the routine is called. S or F can be NULL. In this case the left or */  /*    The coefficient D has to be defined on the integration points or not present. */
 /*    the right hand side of the PDE is not processed.  */  
20    
21  /*    The routine does not consider any boundary conditions. */  /*    lumpedMat has to be initialized before the routine is called. */
22    
23  /**************************************************************/  /**************************************************************/
24    
 /*   Copyrights by ACcESS Australia, 2003,2004 */  
 /*   author: gross@access.edu.au */  
 /*   Version: $Id$ */  
   
 /**************************************************************/  
   
 #include "escript/Data/DataC.h"  
 #include "Finley.h"  
25  #include "Assemble.h"  #include "Assemble.h"
 #include "NodeFile.h"  
 #include "ElementFile.h"  
26  #include "Util.h"  #include "Util.h"
27  #ifdef _OPENMP  #ifdef _OPENMP
28  #include <omp.h>  #include <omp.h>
# Line 47  Line 31 
31    
32  /**************************************************************/  /**************************************************************/
33    
34  void Finley_Assemble_PDE(Finley_NodeFile* nodes,Finley_ElementFile* elements,Finley_SystemMatrix* S, escriptDataC* F,  void Finley_Assemble_LumpedSystem(Finley_NodeFile* nodes,Finley_ElementFile* elements, escriptDataC* lumpedMat, escriptDataC* D, const bool_t useHRZ)
35               escriptDataC* A, escriptDataC* B, escriptDataC* C, escriptDataC* D, escriptDataC* X, escriptDataC* Y ) {  {
   
   double *EM_S=NULL,*EM_F=NULL,*V=NULL,*dVdv=NULL,*dSdV=NULL,*Vol=NULL,*dvdV=NULL;  
   double time0;  
   int dimensions[ESCRIPT_MAX_DATA_RANK],e,q,color;  
   Assemble_Parameters p;  
   maybelong *index_row=NULL,*index_col=NULL;  
36    
37    if (nodes==NULL || elements==NULL) return;    bool_t reducedIntegrationOrder=FALSE, expandedD;
38    if (S==NULL && isEmpty(F)) return;    char error_msg[LenErrorMsg_MAX];
39      Finley_Assemble_Parameters p;
40      dim_t dimensions[ESCRIPT_MAX_DATA_RANK], k, e, len_EM_lumpedMat, q, s, isub;
41      type_t funcspace;
42      index_t color,*row_index=NULL;
43      __const double *D_p=NULL;
44      double *S=NULL, *EM_lumpedMat=NULL, *Vol=NULL, *lumpedMat_p=NULL;
45      register double rtmp;
46      size_t len_EM_lumpedMat_size;
47      register double m_t=0., diagS=0., rtmp2=0.;
48    
49    /* set all parameters in p*/    Finley_resetError();
   Assemble_getAssembleParameters(nodes,elements,S,F,&p);  
   if (Finley_ErrorCode!=NO_ERROR) return;  
50    
51    /*  this function assumes NS=NN */    if (nodes==NULL || elements==NULL) return;
52    if (p.NN!=p.NS) {    if (isEmpty(lumpedMat) || isEmpty(D)) return;
53      Finley_ErrorCode=SYSTEM_ERROR;    if (isEmpty(lumpedMat) && !isEmpty(D)) {
54      sprintf(Finley_ErrorMsg,"for Finley_Assemble_PDE numNodes and numShapes have to be identical.");          Finley_setError(TYPE_ERROR,"Finley_Assemble_LumpedSystem: coefficients are non-zero but no lumped matrix is given.");
55      return;          return;
   }  
   if (p.numDim!=p.numElementDim) {  
     Finley_ErrorCode=SYSTEM_ERROR;  
     sprintf(Finley_ErrorMsg,"Finley_Assemble_PDE accepts volume elements only.");  
     return;  
56    }    }
57    /*  get a functionspace */    funcspace=getFunctionSpaceType(D);
   int funcspace=UNKNOWN;  
   updateFunctionSpaceType(funcspace,A);  
   updateFunctionSpaceType(funcspace,B);  
   updateFunctionSpaceType(funcspace,C);  
   updateFunctionSpaceType(funcspace,D);  
   updateFunctionSpaceType(funcspace,X);  
   updateFunctionSpaceType(funcspace,Y);  
   if (funcspace==UNKNOWN) return; /* all  data are empty */  
   
58    /* check if all function spaces are the same */    /* check if all function spaces are the same */
59      if (funcspace==FINLEY_ELEMENTS) {
60    if (! functionSpaceTypeEqual(funcspace,A) ) {         reducedIntegrationOrder=FALSE;
61          Finley_ErrorCode=TYPE_ERROR;    } else if (funcspace==FINLEY_FACE_ELEMENTS)  {
62          sprintf(Finley_ErrorMsg,"unexpected function space typ for coefficient A");         reducedIntegrationOrder=FALSE;
63    }    } else if (funcspace==FINLEY_REDUCED_ELEMENTS) {
64    if (! functionSpaceTypeEqual(funcspace,B) ) {         reducedIntegrationOrder=TRUE;
65          Finley_ErrorCode=TYPE_ERROR;    } else if (funcspace==FINLEY_REDUCED_FACE_ELEMENTS)  {
66          sprintf(Finley_ErrorMsg,"unexpected function space typ for coefficient B");         reducedIntegrationOrder=TRUE;
67    }    } else {
68    if (! functionSpaceTypeEqual(funcspace,C) ) {         Finley_setError(TYPE_ERROR,"Finley_Assemble_LumpedSystem: assemblage failed because of illegal function space.");
         Finley_ErrorCode=TYPE_ERROR;  
         sprintf(Finley_ErrorMsg,"unexpected function space typ for coefficient C");  
   }  
   if (! functionSpaceTypeEqual(funcspace,D) ) {  
         Finley_ErrorCode=TYPE_ERROR;  
         sprintf(Finley_ErrorMsg,"unexpected function space typ for coefficient D");  
   }  
   if (! functionSpaceTypeEqual(funcspace,X) ) {  
         Finley_ErrorCode=TYPE_ERROR;  
         sprintf(Finley_ErrorMsg,"unexpected function space typ for coefficient X");  
   }  
   if (! functionSpaceTypeEqual(funcspace,Y) ) {  
         Finley_ErrorCode=TYPE_ERROR;  
         sprintf(Finley_ErrorMsg,"unexpected function space typ for coefficient Y");  
69    }    }
70      if (! Finley_noError()) return;
71    
72      /* set all parameters in p*/
73      Finley_Assemble_getAssembleParameters(nodes,elements,NULL,lumpedMat, reducedIntegrationOrder, &p);
74      if (! Finley_noError()) return;
75    
76    /* check if all function spaces are the same */    /* check if all function spaces are the same */
77      if (! numSamplesEqual(D,p.numQuadTotal,elements->numElements) ) {
78    if (! numSamplesEqual(A,p.numQuad,elements->numElements) ) {          sprintf(error_msg,"Finley_Assemble_LumpedSystem: sample points of coefficient D don't match (%d,%d)",p.numQuadSub,elements->numElements);
79          Finley_ErrorCode=TYPE_ERROR;          Finley_setError(TYPE_ERROR,error_msg);
         sprintf(Finley_ErrorMsg,"sample points of coefficient A don't match (%d,%d)",p.numQuad,elements->numElements);  
   }  
   
   if (! numSamplesEqual(B,p.numQuad,elements->numElements) ) {  
         Finley_ErrorCode=TYPE_ERROR;  
         sprintf(Finley_ErrorMsg,"sample points of coefficient B don't match (%d,%d)",p.numQuad,elements->numElements);  
   }  
   
   if (! numSamplesEqual(C,p.numQuad,elements->numElements) ) {  
         Finley_ErrorCode=TYPE_ERROR;  
         sprintf(Finley_ErrorMsg,"sample points of coefficient C don't match (%d,%d)",p.numQuad,elements->numElements);  
   }  
   
   if (! numSamplesEqual(D,p.numQuad,elements->numElements) ) {  
         Finley_ErrorCode=TYPE_ERROR;  
         sprintf(Finley_ErrorMsg,"sample points of coefficient D don't match (%d,%d)",p.numQuad,elements->numElements);  
   }  
   
   if (! numSamplesEqual(X,p.numQuad,elements->numElements) ) {  
         Finley_ErrorCode=TYPE_ERROR;  
         sprintf(Finley_ErrorMsg,"sample points of coefficient X don't match (%d,%d)",p.numQuad,elements->numElements);  
   }  
   
   if (! numSamplesEqual(Y,p.numQuad,elements->numElements) ) {  
         Finley_ErrorCode=TYPE_ERROR;  
         sprintf(Finley_ErrorMsg,"sample points of coefficient Y don't match (%d,%d)",p.numQuad,elements->numElements);  
80    }    }
81    
82    /*  check the dimensions: */    /*  check the dimensions: */
83        if (p.numEqu==1) {
   if (p.numEqu==1 && p.numComp==1) {  
     if (!isEmpty(A)) {  
       dimensions[0]=p.numDim;  
       dimensions[1]=p.numDim;  
       if (!isDataPointShapeEqual(A,2,dimensions)) {  
           Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient A: illegal shape, expected shape (%d,%d)",dimensions[0],dimensions[1]);  
       }  
     }  
     if (!isEmpty(B)) {  
        dimensions[0]=p.numDim;  
        if (!isDataPointShapeEqual(B,1,dimensions)) {  
           Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient B: illegal shape (%d,)",dimensions[0]);  
        }  
     }  
     if (!isEmpty(C)) {  
        dimensions[0]=p.numDim;  
        if (!isDataPointShapeEqual(C,1,dimensions)) {  
           Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient C, expected shape (%d,)",dimensions[0]);  
        }  
     }  
84      if (!isEmpty(D)) {      if (!isEmpty(D)) {
85         if (!isDataPointShapeEqual(D,0,dimensions)) {         if (!isDataPointShapeEqual(D,0,dimensions)) {
86            Finley_ErrorCode=TYPE_ERROR;            Finley_setError(TYPE_ERROR,"Finley_Assemble_LumpedSystem: coefficient D, rank 0 expected.");
           sprintf(Finley_ErrorMsg,"coefficient D, rank 0 expected.");  
        }  
     }  
     if (!isEmpty(X)) {  
        dimensions[0]=p.numDim;  
        if (!isDataPointShapeEqual(X,1,dimensions)) {  
           Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient X, expected shape (%d,",dimensions[0]);  
87         }         }
88    
89      }      }
     if (!isEmpty(Y)) {  
        if (!isDataPointShapeEqual(Y,0,dimensions)) {  
           Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient Y, rank 0 expected.");  
        }  
     }  
90    } else {    } else {
     if (!isEmpty(A)) {  
       dimensions[0]=p.numEqu;  
       dimensions[1]=p.numDim;  
       dimensions[2]=p.numComp;  
       dimensions[3]=p.numDim;  
       if (!isDataPointShapeEqual(A,4,dimensions)) {  
           Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient A, expected shape (%d,%d,%d,%d)",dimensions[0],dimensions[1],dimensions[2],dimensions[3]);  
       }  
     }  
     if (!isEmpty(B)) {  
       dimensions[0]=p.numEqu;  
       dimensions[1]=p.numDim;  
       dimensions[2]=p.numComp;  
       if (!isDataPointShapeEqual(B,3,dimensions)) {  
           Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient B, expected shape (%d,%d,%d)",dimensions[0],dimensions[1],dimensions[2]);  
       }  
     }  
     if (!isEmpty(C)) {  
       dimensions[0]=p.numEqu;  
       dimensions[1]=p.numComp;  
       dimensions[2]=p.numDim;  
       if (!isDataPointShapeEqual(C,3,dimensions)) {  
            Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient C, expected shape (%d,%d,%d)",dimensions[0],dimensions[1],dimensions[2]);  
       }  
     }  
91      if (!isEmpty(D)) {      if (!isEmpty(D)) {
92        dimensions[0]=p.numEqu;        dimensions[0]=p.numEqu;
93        dimensions[1]=p.numComp;        if (!isDataPointShapeEqual(D,1,dimensions)) {
94        if (!isDataPointShapeEqual(D,2,dimensions)) {            sprintf(error_msg,"Finley_Assemble_LumpedSystem: coefficient D, expected shape (%d,)",dimensions[0]);
95            Finley_ErrorCode=TYPE_ERROR;            Finley_setError(TYPE_ERROR,error_msg);
           sprintf(Finley_ErrorMsg,"coefficient D, expected shape (%d,%d)",dimensions[0],dimensions[1]);  
       }  
     }  
     if (!isEmpty(X)) {  
       dimensions[0]=p.numEqu;  
       dimensions[1]=p.numDim;  
       if (!isDataPointShapeEqual(X,2,dimensions)) {  
            Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient X, expected shape (%d,%d)",dimensions[0],dimensions[1]);  
       }  
     }  
     if (!isEmpty(Y)) {  
       dimensions[0]=p.numEqu;  
       if (!isDataPointShapeEqual(Y,1,dimensions)) {  
            Finley_ErrorCode=TYPE_ERROR;  
           sprintf(Finley_ErrorMsg,"coefficient Y, expected shape (%d,)",dimensions[0]);  
96        }        }
97      }      }
98    }    }
99      if (Finley_noError()) {
100    if (Finley_ErrorCode==NO_ERROR) {      requireWrite(lumpedMat);
101       time0=Finley_timer();      lumpedMat_p=getSampleDataRW(lumpedMat,0);
102       #pragma omp parallel private(index_col,index_row,EM_S,EM_F,V,dVdv,dSdV,Vol,dvdV,color,q) \      len_EM_lumpedMat=p.row_numShapesTotal*p.numEqu;
103              firstprivate(elements,nodes,S,F,A,B,C,D,X,Y)      len_EM_lumpedMat_size=len_EM_lumpedMat*sizeof(double);
      {  
          EM_S=EM_F=V=dVdv=dSdV=Vol=dvdV=NULL;  
          index_row=index_col=NULL;  
   
          /* allocate work arrays: */  
   
          EM_S=(double*) THREAD_MEMALLOC(p.NN_row*p.NN_col*p.numEqu*p.numComp,double);  
          EM_F=(double*) THREAD_MEMALLOC(p.NN_row*p.numEqu,double);  
          V=(double*) THREAD_MEMALLOC(p.NN*p.numDim,double);  
          dVdv=(double*) THREAD_MEMALLOC(p.numDim*p.numDim*p.numQuad,double);  
          dvdV=(double*) THREAD_MEMALLOC(p.numDim*p.numDim*p.numQuad,double);  
          dSdV=(double*) THREAD_MEMALLOC(p.NS_row*p.numQuad*p.numDim,double);  
          Vol=(double*) THREAD_MEMALLOC(p.numQuad,double);  
          index_col=(maybelong*) THREAD_MEMALLOC(p.NN_col,maybelong);  
          index_row=(maybelong*) THREAD_MEMALLOC(p.NN_row,maybelong);  
   
          if (! (Finley_checkPtr(EM_S) || Finley_checkPtr(EM_F) || Finley_checkPtr(V) || Finley_checkPtr(index_col) ||  
                 Finley_checkPtr(index_row) || Finley_checkPtr(dVdv) || Finley_checkPtr(dSdV) || Finley_checkPtr(Vol) ))  {  
   
            /*  open loop over all colors: */  
            for (color=0;color<elements->numColors;color++) {  
               /*  open loop over all elements: */  
               #pragma omp for private(e) schedule(static)  
               for(e=0;e<elements->numElements;e++){  
                 if (elements->Color[e]==color) {  
                   for (q=0;q<p.NN_row;q++) index_row[q]=p.label_row[elements->Nodes[INDEX2(p.row_node[q],e,p.NN)]];  
                   /* gather V-coordinates of nodes into V: */  
           Finley_Util_Gather_double(p.NN,&(elements->Nodes[INDEX2(0,e,p.NN)]),p.numDim,nodes->Coordinates,V);  
                   /*  calculate dVdv(i,j,q)=V(i,k)*DSDv(k,j,q) */  
           Finley_Util_SmallMatMult(p.numDim,p.numDim*p.numQuad,dVdv,p.NS,V,p.referenceElement->dSdv);  
                   /*  dvdV=invert(dVdv) inplace */  
           Finley_Util_InvertSmallMat(p.numQuad,p.numDim,dVdv,dvdV,Vol);  
                   /*  calculate dSdV=DSDv*DvDV */  
           Finley_Util_SmallMatSetMult(p.numQuad,p.NS_row,p.numDim,dSdV,p.numDim,p.referenceElement_row->dSdv,dvdV);  
                   /*  scale volume: */  
           for (q=0;q<p.numQuad;q++) Vol[q]=ABS(Vol[q]*p.referenceElement->QuadWeights[q]);  
104            
105                     /*   integration for the stiffness matrix: */      expandedD=isExpanded(D);
106                     /*   in order to optimze the number of operations the case of constants coefficience needs a bit more work */      S=p.row_jac->BasisFunctions->S;
107                     /*   to make use of some symmetry. */  
108        #pragma omp parallel private(color, EM_lumpedMat, row_index, Vol, D_p, s, q, k, rtmp, diagS, m_t, isub, rtmp2)
109                       if (S!=NULL) {      {
110                         for (q=0;q<p.NN_row*p.NN_col*p.numEqu*p.numComp;q++) EM_S[q]=0;         EM_lumpedMat=THREAD_MEMALLOC(len_EM_lumpedMat,double);
111                         if (p.numEqu==1 && p.numComp==1) {         row_index=THREAD_MEMALLOC(p.row_numShapesTotal,index_t);
112                         Finley_Assemble_PDEMatrix_Single2(p.NS_row,p.numDim,p.numQuad,         if ( !Finley_checkPtr(EM_lumpedMat) && !Finley_checkPtr(row_index) ) {
113                                                                       p.referenceElement_row->S,dSdV,Vol,p.NN_row,EM_S,            if (p.numEqu == 1) { /* single equation */
114                                                                       getSampleData(A,e),isExpanded(A),               if (expandedD) {   /* with expanded D */        
115                                                                       getSampleData(B,e),isExpanded(B),                   for (color=elements->minColor;color<=elements->maxColor;color++) {
116                                                                       getSampleData(C,e),isExpanded(C),                      /*  open loop over all elements: */
117                                                                       getSampleData(D,e),isExpanded(D));                      #pragma omp for private(e) schedule(static)
118                         } else {                      for(e=0;e<elements->numElements;e++){              
119                         Finley_Assemble_PDEMatrix_System2(p.NS_row,p.numDim,p.numQuad,p.numEqu,p.numComp,              if (elements->Color[e]==color) {
120                                                                       p.referenceElement_row->S,dSdV,Vol,p.NN_row,EM_S,                              for (isub=0; isub<p.numSub; isub++) {
121                                                                       getSampleData(A,e),isExpanded(A),                                 Vol=&(p.row_jac->volume[INDEX3(0,isub,e, p.numQuadSub,p.numSub)]);
122                                                                       getSampleData(B,e),isExpanded(B),                                 D_p=getSampleDataRO(D,e);                          
123                                                                       getSampleData(C,e),isExpanded(C),                     if (useHRZ) {
124                                                                       getSampleData(D,e),isExpanded(D));  
125                         }                                     m_t=0; /* mass of the element: m_t */
126                         for (q=0;q<p.NN_col;q++) index_col[q]=p.label_col[elements->Nodes[INDEX2(p.col_node[q],e,p.NN)]];                                     #pragma ivdep
127                         Finley_SystemMatrix_add(S,p.NN_row,index_row,p.numEqu,p.NN_col,index_col,p.numComp,EM_S);                                     for (q=0;q<p.numQuadSub;q++) m_t+=Vol[q]*D_p[INDEX2(q, isub,p.numQuadSub) ];
128                       }                            
129                       if (!isEmpty(F)) {                                     diagS=0; /* diagonal sum: S */
130                         for (q=0;q<p.NN_row*p.numEqu;q++) EM_F[q]=0;                                     for (s=0;s<p.row_numShapes;s++) {
131                         if (p.numEqu==1) {                                        rtmp=0;
132                         Finley_Assemble_RHSMatrix_Single(p.NS_row,p.numDim,p.numQuad,                        #pragma ivdep
133                                                                   p.referenceElement_row->S,dSdV,Vol,p.NN_row,EM_F,                                        for (q=0;q<p.numQuadSub;q++) {
134                                                                   getSampleData(X,e),isExpanded(X),                       rtmp2=S[INDEX2(s,q,p.row_numShapes)];
135                                                                   getSampleData(Y,e),isExpanded(Y));                       rtmp+=Vol[q]*D_p[INDEX2(q, isub,p.numQuadSub)]*rtmp2*rtmp2;
136                         } else {                        }
137                         Finley_Assemble_RHSMatrix_System(p.NS_row,p.numDim,p.numQuad,                                        EM_lumpedMat[INDEX2(0,s,p.numEqu)]=rtmp;
138                                                                   p.numEqu,p.referenceElement_row->S,dSdV,Vol,p.NN_row,EM_F,                                        diagS+=rtmp;
139                                                                   getSampleData(X,e),isExpanded(X),                                     }
140                                                                   getSampleData(Y,e),isExpanded(Y));                                     /* rescale diagonals by m_t/diagS to ensure consistent mass over element */
141                         }                     rtmp=m_t/diagS;
142                         /* add  */                     #pragma ivdep
143                         Finley_Util_AddScatter(p.NN_row,index_row,p.numEqu,EM_F,getSampleData(F,0));                                     for (s=0;s<p.row_numShapes;s++) EM_lumpedMat[INDEX2(0,s,p.numEqu)]*=rtmp;
144                      }                            
145                  }                     } else { /* row-sum lumping */
146                }                                     for (s=0;s<p.row_numShapes;s++) {
147              }                                         rtmp=0;
148           }                         #pragma ivdep
149           /* clean up */                                         for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)]*D_p[INDEX2(q, isub,p.numQuadSub)];
150           THREAD_MEMFREE(EM_S);                                         EM_lumpedMat[INDEX2(0,s,p.numEqu)]=rtmp;
151           THREAD_MEMFREE(EM_F);                                     }
152           THREAD_MEMFREE(V);  
153           THREAD_MEMFREE(dVdv);                     }
154           THREAD_MEMFREE(dvdV);                                 for (q=0;q<p.row_numShapesTotal;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[INDEX2(q,isub,p.row_numShapesTotal)],e,p.NN)]];
155           THREAD_MEMFREE(dSdV);                                 Finley_Util_AddScatter(p.row_numShapesTotal,row_index,p.numEqu,EM_lumpedMat,lumpedMat_p, p.row_DOF_UpperBound);
156           THREAD_MEMFREE(Vol);                  } /* end of isub loop */
157           THREAD_MEMFREE(index_col);                         } /* end color check */  
158           THREAD_MEMFREE(index_row);                      } /* end element loop */
159       }                    } /* end color loop */
160       printf("timing: assemblage PDE: %.4e sec\n",Finley_timer()-time0);  
161    
162                 } else  {  /* with constant D */  
163    
164                     for (color=elements->minColor;color<=elements->maxColor;color++) {
165                        /*  open loop over all elements: */
166                        #pragma omp for private(e) schedule(static)
167                        for(e=0;e<elements->numElements;e++){
168                            if (elements->Color[e]==color) {
169                                for (isub=0; isub<p.numSub; isub++) {
170                                   Vol=&(p.row_jac->volume[INDEX3(0,isub,e, p.numQuadSub,p.numSub)]);                
171                                   D_p=getSampleDataRO(D,e);                          
172                       if (useHRZ) { /* HRZ lumping */
173                                       m_t=0; /* mass of the element: m_t */
174                                       #pragma ivdep
175                                       for (q=0;q<p.numQuadSub;q++) m_t+=Vol[q];
176                                       diagS=0; /* diagonal sum: S */
177                                       for (s=0;s<p.row_numShapes;s++) {
178                                          rtmp=0;
179                          #pragma ivdep
180                                          for (q=0;q<p.numQuadSub;q++){
181                         rtmp2=S[INDEX2(s,q,p.row_numShapes)];
182                          rtmp+=Vol[q]*rtmp2*rtmp2;
183                          }
184                                          EM_lumpedMat[INDEX2(0,s,p.numEqu)]=rtmp;
185                                          diagS+=rtmp;
186                                       }
187                                       /* rescale diagonals by m_t/diagS to ensure consistent mass over element */
188                       rtmp=m_t/diagS*D_p[0];
189                       #pragma ivdep
190                                       for (s=0;s<p.row_numShapes;s++) EM_lumpedMat[INDEX2(0,s,p.numEqu)]*=rtmp;
191                       } else { /* row-sum lumping */
192                                       for (s=0;s<p.row_numShapes;s++) {
193                                           rtmp=0;
194                           #pragma ivdep
195                                           for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)];
196                                           EM_lumpedMat[INDEX2(0,s,p.numEqu)]=rtmp*D_p[0];
197                                       }
198                       }
199                                   for (q=0;q<p.row_numShapesTotal;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[INDEX2(q,isub,p.row_numShapesTotal)],e,p.NN)]];
200                                   Finley_Util_AddScatter(p.row_numShapesTotal,row_index,p.numEqu,EM_lumpedMat,lumpedMat_p, p.row_DOF_UpperBound);
201                                } /* end of isub loop */
202                           } /* end color check */
203                        } /* end element loop */
204                      } /* end color loop */
205            
206                 }
207              } else { /* system of  equation */
208                 if (expandedD) { /* with expanded D */
209                     for (color=elements->minColor;color<=elements->maxColor;color++) {
210                        /*  open loop over all elements: */
211                        #pragma omp for private(e) schedule(static)
212                        for(e=0;e<elements->numElements;e++){
213                           if (elements->Color[e]==color) {
214                  for (isub=0; isub<p.numSub; isub++) {    
215                                  Vol=&(p.row_jac->volume[INDEX3(0,isub,e, p.numQuadSub,p.numSub)]);
216                                  D_p=getSampleDataRO(D,e);  
217                    
218                                  if (useHRZ) { /* HRZ lumping */
219                                      for (k=0;k<p.numEqu;k++) {
220                                          m_t=0; /* mass of the element: m_t */
221                                          #pragma ivdep
222                                          for (q=0;q<p.numQuadSub;q++) m_t+=Vol[q]*D_p[INDEX3(k,q,isub,p.numEqu,p.numQuadSub)];
223                                                      
224                                          diagS=0; /* diagonal sum: S */
225                                          for (s=0;s<p.row_numShapes;s++) {
226                                              rtmp=0;
227                          #pragma ivdep
228                                              for (q=0;q<p.numQuadSub;q++) {
229                             rtmp2=S[INDEX2(s,q,p.row_numShapes)];
230                             rtmp+=Vol[q]*D_p[INDEX3(k,q,isub,p.numEqu,p.numQuadSub)]*rtmp2*rtmp2;
231                          }
232                                              EM_lumpedMat[INDEX2(k,s,p.numEqu)]=rtmp;
233                                              diagS+=rtmp;
234                                           }
235                           /* rescale diagonals by m_t/diagS to ensure consistent mass over element */
236                           rtmp=m_t/diagS;
237                           #pragma ivdep
238                           for (s=0;s<p.row_numShapes;s++) EM_lumpedMat[INDEX2(k,s,p.numEqu)]*=rtmp;
239                        }                
240                      } else { /* row-sum lumping */
241                                      for (s=0;s<p.row_numShapes;s++) {
242                                          for (k=0;k<p.numEqu;k++) {
243                                             rtmp=0.;
244                         #pragma ivdep
245                                             for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)]*D_p[INDEX3(k,q,isub,p.numEqu,p.numQuadSub)];
246                                             EM_lumpedMat[INDEX2(k,s,p.numEqu)]=rtmp;
247                                           }
248                      }
249                      }
250                      for (q=0;q<p.row_numShapesTotal;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[INDEX2(q,isub,p.row_numShapesTotal)],e,p.NN)]];
251                      Finley_Util_AddScatter(p.row_numShapesTotal,row_index,p.numEqu,EM_lumpedMat,lumpedMat_p, p.row_DOF_UpperBound);
252                   } /* end of isub loop */
253                           } /* end color check */
254                        } /* end element loop */
255                    } /* end color loop */
256                 } else { /* with constant D */
257                     for (color=elements->minColor;color<=elements->maxColor;color++) {
258                        /*  open loop over all elements: */
259                        #pragma omp for private(e) schedule(static)
260                        for(e=0;e<elements->numElements;e++){
261                           if (elements->Color[e]==color) {
262                   for (isub=0; isub<p.numSub; isub++) {    
263                                  Vol=&(p.row_jac->volume[INDEX3(0,isub,e, p.numQuadSub,p.numSub)]);
264                                  D_p=getSampleDataRO(D,e);
265                  
266                                  if (useHRZ) { /* HRZ lumping */
267                                          m_t=0; /* mass of the element: m_t */
268                                          #pragma ivdep
269                                          for (q=0;q<p.numQuadSub;q++) m_t+=Vol[q];
270                                          diagS=0; /* diagonal sum: S */
271                                          for (s=0;s<p.row_numShapes;s++) {
272                                              rtmp=0;
273                          #pragma ivdep
274                                              for (q=0;q<p.numQuadSub;q++) {
275                             rtmp2=S[INDEX2(s,q,p.row_numShapes)];
276                             rtmp+=Vol[q]*rtmp2*rtmp2;
277                          }
278                          #pragma ivdep
279                          for (k=0;k<p.numEqu;k++) EM_lumpedMat[INDEX2(k,s,p.numEqu)]=rtmp;
280                                              diagS+=rtmp;
281                                          }
282                                          
283                          /* rescale diagonals by m_t/diagS to ensure consistent mass over element */
284                          rtmp=m_t/diagS;
285                          for (s=0;s<p.row_numShapes;s++) {
286                            #pragma ivdep
287                            for (k=0;k<p.numEqu;k++) EM_lumpedMat[INDEX2(k,s,p.numEqu)]*=rtmp*D_p[k];
288                          }
289                      } else { /* row-sum lumping */
290                                     for (s=0;s<p.row_numShapes;s++) {
291                        for (k=0;k<p.numEqu;k++) {
292                                            rtmp=0.;
293                        #pragma ivdep
294                                            for (q=0;q<p.numQuadSub;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_numShapes)];
295                                            EM_lumpedMat[INDEX2(k,s,p.numEqu)]=rtmp*D_p[k];
296                                         }
297                     }
298                      }
299                      for (q=0;q<p.row_numShapesTotal;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[INDEX2(q,isub,p.row_numShapesTotal)],e,p.NN)]];
300                      Finley_Util_AddScatter(p.row_numShapesTotal,row_index,p.numEqu,EM_lumpedMat,lumpedMat_p, p.row_DOF_UpperBound);
301                  } /* end of isub loop */
302                           } /* end color check */
303                        } /* end element loop */
304                    } /* end color loop */
305                 }
306              }
307           } /* end of pointer check */
308           THREAD_MEMFREE(EM_lumpedMat);
309           THREAD_MEMFREE(row_index);
310        } /* end parallel region */
311    }    }
312  }  }
 /*  
  * $Log$  
  * Revision 1.2  2004/12/14 05:39:29  jgs  
  * *** empty log message ***  
  *  
  * Revision 1.1.1.1.2.1  2004/11/24 01:37:12  gross  
  * some changes dealing with the integer overflow in memory allocation. Finley solves 4M unknowns now  
  *  
  * Revision 1.1.1.1  2004/10/26 06:53:57  jgs  
  * initial import of project esys2  
  *  
  * Revision 1.3  2004/07/30 04:37:06  gross  
  * escript and finley are linking now and RecMeshTest.py has been passed  
  *  
  * Revision 1.2  2004/07/21 05:00:54  gross  
  * name changes in DataC  
  *  
  * Revision 1.1  2004/07/02 04:21:13  gross  
  * Finley C code has been included  
  *  
  *  
  */  

Legend:
Removed from v.97  
changed lines
  Added in v.3379

  ViewVC Help
Powered by ViewVC 1.1.26