Diff of /trunk/finley/src/Assemble_LumpedSystem.c

trunk/esys2/finley/src/finleyC/Assemble_PDE.c revision 97 by jgs, Tue Dec 14 05:39:33 2004 UTC trunk/finley/src/Assemble_LumpedSystem.c revision 1204 by gross, Sat Jun 23 11:43:12 2007 UTC
# Line 1  Line 1
1  /* \$Id\$ */  /*
2     ************************************************************
3  /**************************************************************/   *          Copyright 2006,2007 by ACcENULLNULL MNRF              *
4     *                                                          *
5  /*    assembles the system of numEq PDEs into the stiffness matrix S and right hand side F */   *              http://www.access.edu.au                    *
6     *       Primary Business: Queensland, Australia            *
9  /*      -(A_{k,i,m,j} u_m,j)_i-(B_{k,i,m} u_m)_i+C_{k,m,j} u_m,j-D_{k,m} u_m = -(X_{k,i})_i + Y_k */   *                                                          *
10     ************************************************************
11  /*    u has numComp components. */  */
12
/*    Shape of the coefficients: */
13
14  /*      A = numEqu x numDim x numComp x numDim */  /**************************************************************/
/*      B = numDim x numEqu x numComp  */
/*      C = numEqu x numDim x numComp  */
/*      D = numEqu x numComp  */
/*      X = numEqu x numDim   */
/*      Y = numEqu */
15
16  /*    The coefficients A,B,C,D,X and Y have to be defined on the integartion points or not present (=NULL). */  /*    assembles the mass matrix in lumped form                */
17
18  /*    S and F have to be initialized before the routine is called. S or F can be NULL. In this case the left or */  /*    The coefficient D has to be defined on the integration points or not present. */
/*    the right hand side of the PDE is not processed.  */
19
20  /*    The routine does not consider any boundary conditions. */  /*    lumpedMat has to be initialized before the routine is called. */
21
22  /**************************************************************/  /**************************************************************/
23
24  /*   Copyrights by ACcESS Australia, 2003,2004 */  /*  Author: gross@access.edu.au */
25  /*   author: gross@access.edu.au */  /*  Version: \$Id:\$ */
/*   Version: \$Id\$ */
26
27  /**************************************************************/  /**************************************************************/
28
#include "escript/Data/DataC.h"
#include "Finley.h"
29  #include "Assemble.h"  #include "Assemble.h"
#include "NodeFile.h"
#include "ElementFile.h"
30  #include "Util.h"  #include "Util.h"
31  #ifdef _OPENMP  #ifdef _OPENMP
32  #include <omp.h>  #include <omp.h>
# Line 47  Line 35
35
36  /**************************************************************/  /**************************************************************/
37
38  void Finley_Assemble_PDE(Finley_NodeFile* nodes,Finley_ElementFile* elements,Finley_SystemMatrix* S, escriptDataC* F,  void Finley_Assemble_LumpedSystem(Finley_NodeFile* nodes,Finley_ElementFile* elements, escriptDataC* lumpedMat, escriptDataC* D)
39               escriptDataC* A, escriptDataC* B, escriptDataC* C, escriptDataC* D, escriptDataC* X, escriptDataC* Y ) {  {
40
41    double *EM_S=NULL,*EM_F=NULL,*V=NULL,*dVdv=NULL,*dSdV=NULL,*Vol=NULL,*dvdV=NULL;    bool_t reducedIntegrationOrder=FALSE, expandedD;
42    double time0;    char error_msg[LenErrorMsg_MAX];
int dimensions[ESCRIPT_MAX_DATA_RANK],e,q,color;
43    Assemble_Parameters p;    Assemble_Parameters p;
44    maybelong *index_row=NULL,*index_col=NULL;    double time0;
45      dim_t dimensions[ESCRIPT_MAX_DATA_RANK], k, e, len_EM_lumpedMat, q, s;
46    if (nodes==NULL || elements==NULL) return;    type_t funcspace;
47    if (S==NULL && isEmpty(F)) return;    index_t color,*row_index=NULL;
48      double *S=NULL, *EM_lumpedMat=NULL, *Vol=NULL, *D_p=NULL, *lumpedMat_p=NULL;
49    /* set all parameters in p*/    register double rtmp;
50    Assemble_getAssembleParameters(nodes,elements,S,F,&p);    size_t len_EM_lumpedMat_size;
if (Finley_ErrorCode!=NO_ERROR) return;

/*  this function assumes NS=NN */
if (p.NN!=p.NS) {
Finley_ErrorCode=SYSTEM_ERROR;
sprintf(Finley_ErrorMsg,"for Finley_Assemble_PDE numNodes and numShapes have to be identical.");
return;
}
if (p.numDim!=p.numElementDim) {
Finley_ErrorCode=SYSTEM_ERROR;
sprintf(Finley_ErrorMsg,"Finley_Assemble_PDE accepts volume elements only.");
return;
}
/*  get a functionspace */
int funcspace=UNKNOWN;
updateFunctionSpaceType(funcspace,A);
updateFunctionSpaceType(funcspace,B);
updateFunctionSpaceType(funcspace,C);
updateFunctionSpaceType(funcspace,D);
updateFunctionSpaceType(funcspace,X);
updateFunctionSpaceType(funcspace,Y);
if (funcspace==UNKNOWN) return; /* all  data are empty */
51
52    /* check if all function spaces are the same */    Finley_resetError();
53
54    if (! functionSpaceTypeEqual(funcspace,A) ) {    if (nodes==NULL || elements==NULL) return;
55          Finley_ErrorCode=TYPE_ERROR;    if (isEmpty(lumpedMat) || isEmpty(D)) return;
56          sprintf(Finley_ErrorMsg,"unexpected function space typ for coefficient A");    if (isEmpty(lumpedMat) && !isEmpty(D)) {
57    }          Finley_setError(TYPE_ERROR,"Assemble_LumpedSystem: coefficients are non-zero but no lumped matrix is given.");
58    if (! functionSpaceTypeEqual(funcspace,B) ) {          return;
Finley_ErrorCode=TYPE_ERROR;
sprintf(Finley_ErrorMsg,"unexpected function space typ for coefficient B");
}
if (! functionSpaceTypeEqual(funcspace,C) ) {
Finley_ErrorCode=TYPE_ERROR;
sprintf(Finley_ErrorMsg,"unexpected function space typ for coefficient C");
}
if (! functionSpaceTypeEqual(funcspace,D) ) {
Finley_ErrorCode=TYPE_ERROR;
sprintf(Finley_ErrorMsg,"unexpected function space typ for coefficient D");
}
if (! functionSpaceTypeEqual(funcspace,X) ) {
Finley_ErrorCode=TYPE_ERROR;
sprintf(Finley_ErrorMsg,"unexpected function space typ for coefficient X");
}
if (! functionSpaceTypeEqual(funcspace,Y) ) {
Finley_ErrorCode=TYPE_ERROR;
sprintf(Finley_ErrorMsg,"unexpected function space typ for coefficient Y");
59    }    }
60      funcspace=getFunctionSpaceType(D);
61    /* check if all function spaces are the same */    /* check if all function spaces are the same */
62      if (funcspace==FINLEY_ELEMENTS) {
63    if (! numSamplesEqual(A,p.numQuad,elements->numElements) ) {         reducedIntegrationOrder=FALSE;
64          Finley_ErrorCode=TYPE_ERROR;    } else if (funcspace==FINLEY_FACE_ELEMENTS)  {
65          sprintf(Finley_ErrorMsg,"sample points of coefficient A don't match (%d,%d)",p.numQuad,elements->numElements);         reducedIntegrationOrder=FALSE;
66      } else if (funcspace==FINLEY_REDUCED_ELEMENTS) {
67           reducedIntegrationOrder=TRUE;
68      } else if (funcspace==FINLEY_REDUCED_FACE_ELEMENTS)  {
69           reducedIntegrationOrder=TRUE;
70      } else {
71           Finley_setError(TYPE_ERROR,"Assemble_LumpedSystem: assemblage failed because of illegal function space.");
72    }    }
73      if (! Finley_noError()) return;
74
75    if (! numSamplesEqual(B,p.numQuad,elements->numElements) ) {    /* set all parameters in p*/
76          Finley_ErrorCode=TYPE_ERROR;    Assemble_getAssembleParameters(nodes,elements,NULL,lumpedMat, reducedIntegrationOrder, &p);
77          sprintf(Finley_ErrorMsg,"sample points of coefficient B don't match (%d,%d)",p.numQuad,elements->numElements);    if (! Finley_noError()) return;
}
78
79    if (! numSamplesEqual(C,p.numQuad,elements->numElements) ) {    /* check if all function spaces are the same */
Finley_ErrorCode=TYPE_ERROR;
sprintf(Finley_ErrorMsg,"sample points of coefficient C don't match (%d,%d)",p.numQuad,elements->numElements);
}
80
82          Finley_ErrorCode=TYPE_ERROR;          sprintf(error_msg,"Assemble_LumpedSystem: sample points of coefficient D don't match (%d,%d)",p.numQuad,elements->numElements);
83          sprintf(Finley_ErrorMsg,"sample points of coefficient D don't match (%d,%d)",p.numQuad,elements->numElements);          Finley_setError(TYPE_ERROR,error_msg);
}

Finley_ErrorCode=TYPE_ERROR;
sprintf(Finley_ErrorMsg,"sample points of coefficient X don't match (%d,%d)",p.numQuad,elements->numElements);
}

Finley_ErrorCode=TYPE_ERROR;
sprintf(Finley_ErrorMsg,"sample points of coefficient Y don't match (%d,%d)",p.numQuad,elements->numElements);
84    }    }
85
86    /*  check the dimensions: */    /*  check the dimensions: */
87
88    if (p.numEqu==1 && p.numComp==1) {    if (p.numEqu==1) {
if (!isEmpty(A)) {
dimensions[0]=p.numDim;
dimensions[1]=p.numDim;
if (!isDataPointShapeEqual(A,2,dimensions)) {
Finley_ErrorCode=TYPE_ERROR;
sprintf(Finley_ErrorMsg,"coefficient A: illegal shape, expected shape (%d,%d)",dimensions[0],dimensions[1]);
}
}
if (!isEmpty(B)) {
dimensions[0]=p.numDim;
if (!isDataPointShapeEqual(B,1,dimensions)) {
Finley_ErrorCode=TYPE_ERROR;
sprintf(Finley_ErrorMsg,"coefficient B: illegal shape (%d,)",dimensions[0]);
}
}
if (!isEmpty(C)) {
dimensions[0]=p.numDim;
if (!isDataPointShapeEqual(C,1,dimensions)) {
Finley_ErrorCode=TYPE_ERROR;
sprintf(Finley_ErrorMsg,"coefficient C, expected shape (%d,)",dimensions[0]);
}
}
89      if (!isEmpty(D)) {      if (!isEmpty(D)) {
90         if (!isDataPointShapeEqual(D,0,dimensions)) {         if (!isDataPointShapeEqual(D,0,dimensions)) {
91            Finley_ErrorCode=TYPE_ERROR;            Finley_setError(TYPE_ERROR,"Assemble_LumpedSystem: coefficient D, rank 0 expected.");
sprintf(Finley_ErrorMsg,"coefficient D, rank 0 expected.");
}
}
if (!isEmpty(X)) {
dimensions[0]=p.numDim;
if (!isDataPointShapeEqual(X,1,dimensions)) {
Finley_ErrorCode=TYPE_ERROR;
sprintf(Finley_ErrorMsg,"coefficient X, expected shape (%d,",dimensions[0]);
92         }         }
93
94      }      }
if (!isEmpty(Y)) {
if (!isDataPointShapeEqual(Y,0,dimensions)) {
Finley_ErrorCode=TYPE_ERROR;
sprintf(Finley_ErrorMsg,"coefficient Y, rank 0 expected.");
}
}
95    } else {    } else {
if (!isEmpty(A)) {
dimensions[0]=p.numEqu;
dimensions[1]=p.numDim;
dimensions[2]=p.numComp;
dimensions[3]=p.numDim;
if (!isDataPointShapeEqual(A,4,dimensions)) {
Finley_ErrorCode=TYPE_ERROR;
sprintf(Finley_ErrorMsg,"coefficient A, expected shape (%d,%d,%d,%d)",dimensions[0],dimensions[1],dimensions[2],dimensions[3]);
}
}
if (!isEmpty(B)) {
dimensions[0]=p.numEqu;
dimensions[1]=p.numDim;
dimensions[2]=p.numComp;
if (!isDataPointShapeEqual(B,3,dimensions)) {
Finley_ErrorCode=TYPE_ERROR;
sprintf(Finley_ErrorMsg,"coefficient B, expected shape (%d,%d,%d)",dimensions[0],dimensions[1],dimensions[2]);
}
}
if (!isEmpty(C)) {
dimensions[0]=p.numEqu;
dimensions[1]=p.numComp;
dimensions[2]=p.numDim;
if (!isDataPointShapeEqual(C,3,dimensions)) {
Finley_ErrorCode=TYPE_ERROR;
sprintf(Finley_ErrorMsg,"coefficient C, expected shape (%d,%d,%d)",dimensions[0],dimensions[1],dimensions[2]);
}
}
96      if (!isEmpty(D)) {      if (!isEmpty(D)) {
97        dimensions[0]=p.numEqu;        dimensions[0]=p.numEqu;
98        dimensions[1]=p.numComp;        if (!isDataPointShapeEqual(D,1,dimensions)) {
99        if (!isDataPointShapeEqual(D,2,dimensions)) {            sprintf(error_msg,"Assemble_LumpedSystem: coefficient D, expected shape (%d,)",dimensions[0]);
100            Finley_ErrorCode=TYPE_ERROR;            Finley_setError(TYPE_ERROR,error_msg);
101            sprintf(Finley_ErrorMsg,"coefficient D, expected shape (%d,%d)",dimensions[0],dimensions[1]);        }
102        }      }
103      }    }
104      if (!isEmpty(X)) {
105        dimensions[0]=p.numEqu;    if (Finley_noError()) {
106        dimensions[1]=p.numDim;      lumpedMat_p=getSampleData(lumpedMat,0);
107        if (!isDataPointShapeEqual(X,2,dimensions)) {      len_EM_lumpedMat=p.row_NN*p.numEqu;
108             Finley_ErrorCode=TYPE_ERROR;      len_EM_lumpedMat_size=len_EM_lumpedMat*sizeof(double);
109            sprintf(Finley_ErrorMsg,"coefficient X, expected shape (%d,%d)",dimensions[0],dimensions[1]);      expandedD=isExpanded(D);
110        }      S=p.row_jac->ReferenceElement->S;
111      }
112      if (!isEmpty(Y)) {      #pragma omp parallel private(color, EM_lumpedMat, row_index, Vol, D_p, s, q, k, rtmp)
113        dimensions[0]=p.numEqu;      {
116            sprintf(Finley_ErrorMsg,"coefficient Y, expected shape (%d,)",dimensions[0]);         if ( !Finley_checkPtr(EM_lumpedMat) && !Finley_checkPtr(row_index) ) {
117        }            if (p.numEqu == 1) {
118      }               if (expandedD) {
119    }                   #ifndef PASO_MPI
120                     for (color=elements->minColor;color<=elements->maxColor;color++) {
121    if (Finley_ErrorCode==NO_ERROR) {                      /*  open loop over all elements: */
122       time0=Finley_timer();                      #pragma omp for private(e) schedule(static)
123       #pragma omp parallel private(index_col,index_row,EM_S,EM_F,V,dVdv,dSdV,Vol,dvdV,color,q) \                      for(e=0;e<elements->numElements;e++){
124              firstprivate(elements,nodes,S,F,A,B,C,D,X,Y)                         if (elements->Color[e]==color) {
125       {                   #else
126           EM_S=EM_F=V=dVdv=dSdV=Vol=dvdV=NULL;                   {
127           index_row=index_col=NULL;                      for(e=0;e<elements->numElements;e++) {
128                           {
129           /* allocate work arrays: */                   #endif
133           V=(double*) THREAD_MEMALLOC(p.NN*p.numDim,double);                            for (s=0;s<p.row_NS;s++) {
138           index_col=(maybelong*) THREAD_MEMALLOC(p.NN_col,maybelong);                            for (q=0;q<p.row_NN;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[q],e,p.NN)]];
140                           } /* end color check */
141           if (! (Finley_checkPtr(EM_S) || Finley_checkPtr(EM_F) || Finley_checkPtr(V) || Finley_checkPtr(index_col) ||                      } /* end element loop */
142                  Finley_checkPtr(index_row) || Finley_checkPtr(dVdv) || Finley_checkPtr(dSdV) || Finley_checkPtr(Vol) ))  {                    } /* end color loop */
143                 } else  {
144             /*  open loop over all colors: */                   #ifndef PASO_MPI
145             for (color=0;color<elements->numColors;color++) {                   for (color=elements->minColor;color<=elements->maxColor;color++) {
146                /*  open loop over all elements: */                   /*  open loop over all elements: */
147                #pragma omp for private(e) schedule(static)                   #pragma omp for private(e) schedule(static)
148                for(e=0;e<elements->numElements;e++){                   for(e=0;e<elements->numElements;e++){
149                  if (elements->Color[e]==color) {                      if (elements->Color[e]==color) {
150                    for (q=0;q<p.NN_row;q++) index_row[q]=p.label_row[elements->Nodes[INDEX2(p.row_node[q],e,p.NN)]];                   #else
151                    /* gather V-coordinates of nodes into V: */                   {
152            Finley_Util_Gather_double(p.NN,&(elements->Nodes[INDEX2(0,e,p.NN)]),p.numDim,nodes->Coordinates,V);                      for(e=0;e<elements->numElements;e++) {
153                    /*  calculate dVdv(i,j,q)=V(i,k)*DSDv(k,j,q) */                         {
155                    /*  dvdV=invert(dVdv) inplace */                             Vol=&(p.row_jac->volume[INDEX2(0,e,p.numQuad)]);
157                    /*  calculate dSdV=DSDv*DvDV */                             D_p=getSampleData(D,e);
159                    /*  scale volume: */                                 rtmp=0;
161                                       EM_lumpedMat[INDEX2(0,s,p.numEqu)]+=rtmp*D_p[0];
162                     /*   integration for the stiffness matrix: */                             }
163                     /*   in order to optimze the number of operations the case of constants coefficience needs a bit more work */                             for (q=0;q<p.row_NN;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[q],e,p.NN)]];
164                     /*   to make use of some symmetry. */                             Finley_Util_AddScatter(p.row_NN,row_index,p.numEqu,EM_lumpedMat,lumpedMat_p, p.row_DOF_UpperBound);
165                          } /* end color check */
166                       if (S!=NULL) {                      } /* end element loop */
167                         for (q=0;q<p.NN_row*p.NN_col*p.numEqu*p.numComp;q++) EM_S[q]=0;                   } /* end color loop */
168                         if (p.numEqu==1 && p.numComp==1) {               }
170                                                                       p.referenceElement_row->S,dSdV,Vol,p.NN_row,EM_S,               if (expandedD) {
171                                                                       getSampleData(A,e),isExpanded(A),                   #ifndef PASO_MPI
172                                                                       getSampleData(B,e),isExpanded(B),                   for (color=elements->minColor;color<=elements->maxColor;color++) {
173                                                                       getSampleData(C,e),isExpanded(C),                      /*  open loop over all elements: */
174                                                                       getSampleData(D,e),isExpanded(D));                      #pragma omp for private(e) schedule(static)
175                         } else {                      for(e=0;e<elements->numElements;e++){
177                                                                       p.referenceElement_row->S,dSdV,Vol,p.NN_row,EM_S,                   #else
178                                                                       getSampleData(A,e),isExpanded(A),                   {
179                                                                       getSampleData(B,e),isExpanded(B),                      for(e=0;e<elements->numElements;e++) {
180                                                                       getSampleData(C,e),isExpanded(C),                         {
181                                                                       getSampleData(D,e),isExpanded(D));                   #endif
183                         for (q=0;q<p.NN_col;q++) index_col[q]=p.label_col[elements->Nodes[INDEX2(p.col_node[q],e,p.NN)]];                            memset(EM_lumpedMat,0,len_EM_lumpedMat_size);
185                       }                            for (s=0;s<p.row_NS;s++) {
186                       if (!isEmpty(F)) {                                for (k=0;k<p.numEqu;k++) {
187                         for (q=0;q<p.NN_row*p.numEqu;q++) EM_F[q]=0;                                    rtmp=0.;
188                         if (p.numEqu==1) {                                    for (q=0;q<p.numQuad;q++) rtmp+=Vol[q]*S[INDEX2(s,q,p.row_NS)]*D_p[INDEX2(k,q,p.numEqu)];
190                                                                   p.referenceElement_row->S,dSdV,Vol,p.NN_row,EM_F,                                }
191                                                                   getSampleData(X,e),isExpanded(X),                            }
192                                                                   getSampleData(Y,e),isExpanded(Y));                            for (q=0;q<p.row_NN;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[q],e,p.NN)]];
193                         } else {                            Finley_Util_AddScatter(p.row_NN,row_index,p.numEqu,EM_lumpedMat,lumpedMat_p, p.row_DOF_UpperBound);
194                         Finley_Assemble_RHSMatrix_System(p.NS_row,p.numDim,p.numQuad,                         } /* end color check */
195                                                                   p.numEqu,p.referenceElement_row->S,dSdV,Vol,p.NN_row,EM_F,                      } /* end element loop */
196                                                                   getSampleData(X,e),isExpanded(X),                  } /* end color loop */
197                                                                   getSampleData(Y,e),isExpanded(Y));               } else {
198                         }                   #ifndef PASO_MPI
199                         /* add  */                   for (color=elements->minColor;color<=elements->maxColor;color++) {
200                         Finley_Util_AddScatter(p.NN_row,index_row,p.numEqu,EM_F,getSampleData(F,0));                      /*  open loop over all elements: */
201                      }                      #pragma omp for private(e) schedule(static)
202                  }                      for(e=0;e<elements->numElements;e++){
203                }                         if (elements->Color[e]==color) {
204              }                   #else
205           }                   {
206           /* clean up */                      for(e=0;e<elements->numElements;e++) {
216       }                            }
217       printf("timing: assemblage PDE: %.4e sec\n",Finley_timer()-time0);                            for (q=0;q<p.row_NN;q++) row_index[q]=p.row_DOF[elements->Nodes[INDEX2(p.row_node[q],e,p.NN)]];
219                           } /* end color check */
220                        } /* end element loop */
221                    } /* end color loop */
222                 }
223              }
224           } /* end of pointer check */
227        } /* end parallel region */
228      }
229      #ifdef Finley_TRACE
230      printf("timing: assemblage lumped PDE: %.4e sec\n",Finley_timer()-time0);
231      #endif
232  }  }
/*
* \$Log\$
* Revision 1.2  2004/12/14 05:39:29  jgs
* *** empty log message ***
*
* Revision 1.1.1.1.2.1  2004/11/24 01:37:12  gross
* some changes dealing with the integer overflow in memory allocation. Finley solves 4M unknowns now
*
* Revision 1.1.1.1  2004/10/26 06:53:57  jgs
* initial import of project esys2
*
* Revision 1.3  2004/07/30 04:37:06  gross
* escript and finley are linking now and RecMeshTest.py has been passed
*
* Revision 1.2  2004/07/21 05:00:54  gross
* name changes in DataC
*
* Revision 1.1  2004/07/02 04:21:13  gross
* Finley C code has been included
*
*
*/

Legend:
 Removed from v.97 changed lines Added in v.1204