/ - Diff - Bench4GPU - Forge du Centre Blaise Pascal

Révision 251

     # Makefile designed for Debian Buster
     SOURCE=xTRSV.c
     CC=gcc
     FC=gfortran
     CFLAGS=-Wall -O3
     LDFLAGS=-lm
     CUDASRC=/usr/share/doc/nvidia-cuda-doc/examples/
     CUDAINC?=/usr/include
     CUDALIB?=/usr/lib/x86_64-linux-gnu/
     CUDASRC?=/usr/share/doc/nvidia-cuda-doc/examples/
     THUNKING=fortran_thunking.c
     CUDASRCINC=fortran_common.h
     CUDAINC=/usr/include
     CUDALIB=/usr/lib/x86_64-linux-gnu/
     GSLINC=/usr/include/gsl
     GOTO2=/opt/GotoBLAS2
     # OPENBLAS=/usr/lib/x86_64-linux-gnu
     # ATLAS=/usr/lib/x86_64-linux-gnu
     OPENBLAS=/usr/lib
     ATLAS=/usr/lib/atlas-base
     ACML=/opt/acml
     ACMLINC=$(ACML)/gfortran64_mp/include
     ACMLLIB=$(ACML)/gfortran64_mp/lib
     #EXECUTABLE=cblas fblas gsl cublas thunking gotoblas acml openblas
     #EXECUTABLE=cblas fblas gsl cublas thunking acml openblas
     EXECUTABLE=cblas fblas gsl cublas thunking openblas
     #FORMAT=DOUBLE
     FORMAT=FLOAT
     # FORMAT define the precision of Floating Point numbers
     # FP32 for simple of 32 bits size
     # FP64 for double of 64 bits size
     #FORMAT=FP64
     FORMAT=FP32
     #DIRECTIVES=-D$(FORMAT) -DPRINT -DUNIT
     #DIRECTIVES=-D$(FORMAT) -DUNIT -DRESULTS -DQUIET
-...
     cblas: $(SOURCE)
     	$(CC) $(CFLAGS) $(DIRECTIVES) -DFLOAT -DCBLAS $(LDFLAGS) \
     		$(SOURCE) $(ATLAS)/libcblas.a $(ATLAS)/libatlas.a -o $(SOURCE:.c=)_SP_$@
     	$(CC) $(CFLAGS) $(DIRECTIVES) -DFP32 -DCBLAS $(LDFLAGS) \
     		$(SOURCE) -latlas -lcblas -o $(SOURCE:.c=)_SP_$@
     	$(CC) $(CFLAGS) $(DIRECTIVES) -DDOUBLE -DCBLAS $(LDFLAGS) \
     		$(SOURCE) $(ATLAS)/libcblas.a $(ATLAS)/libatlas.a -o $(SOURCE:.c=)_DP_$@
     	$(CC) $(CFLAGS) $(DIRECTIVES) -DFP64 -DCBLAS $(LDFLAGS) \
     		$(SOURCE) -latlas -lcblas -o $(SOURCE:.c=)_DP_$@
     openblas: $(SOURCE)
     	$(CC) $(CFLAGS) $(DIRECTIVES) -DFLOAT -DCBLAS $(LDFLAGS) \
     		$(SOURCE) $(OPENBLAS)/libopenblas.a -lpthread -o $(SOURCE:.c=)_SP_$@
     	$(CC) $(CFLAGS) $(DIRECTIVES) -DFP32 -DCBLAS $(LDFLAGS) \
     		$(SOURCE) -lopenblas -lpthread -o $(SOURCE:.c=)_SP_$@
     	$(CC) $(CFLAGS) $(DIRECTIVES) -DDOUBLE -DCBLAS $(LDFLAGS) \
     		$(SOURCE) $(OPENBLAS)/libopenblas.a -lpthread -o $(SOURCE:.c=)_DP_$@
     	$(CC) $(CFLAGS) $(DIRECTIVES) -DFP64 -DCBLAS $(LDFLAGS) \
     		$(SOURCE) -lopenblas -lpthread -o $(SOURCE:.c=)_DP_$@
     acml: $(SOURCE)
     	$(CC) -I$(ACMLINC) $(CFLAGS) $(DIRECTIVES) -DFLOAT -DACML $(LDFLAGS) \
     	$(CC) -I$(ACMLINC) $(CFLAGS) $(DIRECTIVES) -DFP32 -DACML $(LDFLAGS) \
     		$(SOURCE) -L$(ACMLLIB) -lacml_mp -lacml_mv \
     		-lgomp -lgfortran -lpthread -o $(SOURCE:.c=)_SP_$@
     	$(CC) -I$(ACMLINC) $(CFLAGS) $(DIRECTIVES) -DDOUBLE -DACML $(LDFLAGS) \
     	$(CC) -I$(ACMLINC) $(CFLAGS) $(DIRECTIVES) -DFP64 -DACML $(LDFLAGS) \
     		$(SOURCE) -L$(ACMLLIB) -lacml_mp -lacml_mv \
     		-lgomp -lgfortran -lpthread -o $(SOURCE:.c=)_DP_$@
     fblas: $(SOURCE)
     	$(CC) $(CFLAGS) $(DIRECTIVES) -DFLOAT -DFBLAS $(LDFLAGS) \
     		$(SOURCE) $(ATLAS)/libf77blas.a $(ATLAS)/libatlas.a -lgfortran -o $(SOURCE:.c=)_SP_$@
     	# ATLAS version
     	# $(CC) -L$(ATLAS) $(CFLAGS) $(DIRECTIVES) -DFP32 -DFBLAS $(LDFLAGS) \
     	#  	$(SOURCE) -latlas -lf77blas -o $(SOURCE:.c=)_SP_$@
     	$(CC) $(CFLAGS) $(DIRECTIVES) -DDOUBLE -DFBLAS $(LDFLAGS) \
     		$(SOURCE) $(ATLAS)/libf77blas.a $(ATLAS)/libatlas.a -lgfortran -o $(SOURCE:.c=)_DP_$@
     	# $(CC) -L$(ATLAS) $(CFLAGS) $(DIRECTIVES) -DFP64 -DFBLAS $(LDFLAGS) \
     	#  	$(SOURCE) -latlas -lf77blas -o $(SOURCE:.c=)_DP_$@
     	# OpenBLAS version
     	$(CC) $(CFLAGS) $(DIRECTIVES) -DFP32 -DFBLAS $(LDFLAGS) \
     	  	$(SOURCE) -lopenblas -lpthread -o $(SOURCE:.c=)_SP_$@
     	$(CC) $(CFLAGS) $(DIRECTIVES) -DFP64 -DFBLAS $(LDFLAGS) \
     	  	$(SOURCE) -lopenblas -lpthread -o $(SOURCE:.c=)_DP_$@
     gsl: $(SOURCE)
     	$(CC) -I$(GSLINC) $(CFLAGS) $(DIRECTIVES) -DFLOAT -DGSL $(LDFLAGS) \
     	$(CC) -I$(GSLINC) $(CFLAGS) $(DIRECTIVES) -DFP32 -DGSL $(LDFLAGS) \
     		$(SOURCE) -lgslcblas -o $(SOURCE:.c=)_SP_$@
     	$(CC) -I$(GSLINC) $(CFLAGS) $(DIRECTIVES) -DDOUBLE -DGSL $(LDFLAGS) \
     	$(CC) -I$(GSLINC) $(CFLAGS) $(DIRECTIVES) -DFP64 -DGSL $(LDFLAGS) \
     		$(SOURCE) -lgslcblas -o $(SOURCE:.c=)_DP_$@
     cublas: $(SOURCE)
     	$(CC) -I$(CUDAINC) -L$(CUDALIB) $(CFLAGS) -DCUBLAS -DFLOAT $(LDFLAGS) \
     	$(CC) -I$(CUDAINC) -L$(CUDALIB) $(CFLAGS) -DCUBLAS -DFP32 $(LDFLAGS) \
     		$(DIRECTIVES) $(SOURCE) -lcublas -o $(SOURCE:.c=)_SP_$@
     	$(CC) -I$(CUDAINC) -L$(CUDALIB) $(CFLAGS) -DCUBLAS -DDOUBLE $(LDFLAGS) \
     	$(CC) -I$(CUDAINC) -L$(CUDALIB) $(CFLAGS) -DCUBLAS -DFP64 $(LDFLAGS) \
     		$(DIRECTIVES) $(SOURCE) -lcublas -o $(SOURCE:.c=)_DP_$@
     thunking: $(SOURCE)
-...
     	$(CC) -DCUBLAS_GFORTRAN -I$(CUDAINC) $(CFLAGS) -c $(THUNKING)
     	$(CC) -DCUBLAS_GFORTRAN -I$(CUDAINC) -L$(CUDALIB) $(CFLAGS) -DTHUNKING \
     		$(LDFLAGS) $(DIRECTIVES) $(SOURCE) -DFLOAT \
     		$(LDFLAGS) $(DIRECTIVES) $(SOURCE) -DFP32 \
     		$(THUNKING:.c=.o) -lcublas -o $(SOURCE:.c=)_SP_$@
     	$(CC) -DCUBLAS_GFORTRAN -I$(CUDAINC) -L$(CUDALIB) $(CFLAGS) -DTHUNKING \
     		$(LDFLAGS) $(DIRECTIVES) $(SOURCE) -DDOUBLE \
     		$(LDFLAGS) $(DIRECTIVES) $(SOURCE) -DFP64 \
     		$(THUNKING:.c=.o) -lcublas -o $(SOURCE:.c=)_DP_$@
     clean: $(SOURCE)

     #include "fortran_common.h"
     #include "fortran_thunking.h"
     #elif FBLAS
     #include <cblas.h>
     #include <cblas_f77.h>
     #include <f77blas.h>
     #elif GSL
     #include <gsl_cblas.h>
     #elif ACML
     #include <acml.h>
     #else
     #include <cblas.h>
     #include <blaswrap.h>
     // #include <blaswrap.h>
     #endif
     #ifdef DOUBLE
     #ifdef FP64
     #define LENGTH double
     #else
     #define LENGTH float
-...
       for (i=0;i<RUNS;i++)
+        {
     #ifdef DOUBLE
     #ifdef FP64
           printVectorGPU(dim,devPtrX,"X","Roots");
-...
       for (i=0;i<RUNS;i++)
+        {
     #ifdef DOUBLE
     #ifdef FP64
           printVector(dim,X,"X","Roots");
-...
       for (i=0;i<RUNS;i++)
+        {
     #ifdef DOUBLE
     #ifdef FP64
           printVector(dim,X,"X","Initial roots");
           /* /\* Multiply A by X as Y <- A.X *\/ */
           /* dgemv_(&trans,&dim,&dim,&alpha,A,&dim,X,&incx,&beta,Y,&incx); */
           /* printVector(dim,Y,"Y<-A.X","Estimated results"); */
           /* /\* Solve linear system *\/ */
           /* dtrsv_(&uplo,&trans,&diag,&dim,A,&dim,Y,&incx); */
           /* printVector(dim,Y,"X","Solutions from A.X=Y"); */
           /* /\* Compare the roots X and Y *\/ */
           /* daxpy_(&dim,&beta2,Y,&incx,X,&incx); */
           /* printVector(dim,X,"X","Differences initial and estimated"); */
           /* /\* Store the checker of errors *\/ */
           /* dnrm2_(&dim,X,&incx,&checksA[i]); */
           /* /\* Swap vector X and Y *\/ */
           /* dswap_(&dim,X,&incx,Y,&incx); */
           /* Multiply A by X as Y <- A.X */
           dgemv_(&trans,&dim,&dim,&alpha,A,&dim,X,&incx,&beta,Y,&incx);
-...
           printVector(dim,X,"X","Differences initial and estimated");
           /* Store the checker of errors */
           dnrm2_(&dim,X,&incx,&checksA[i]);
           checksA[i]=(double)dnrm2_(&dim,X,&incx);
           /* Swap vector X and Y */
           dswap_(&dim,X,&incx,Y,&incx);
-...
           printVector(dim,X,"X","Errors");
           /* Store the checker of errors */
           snrm2_(&dim,X,&incx,&checksA[i]);
           checksA[i]=(LENGTH)snrm2_(&dim,X,&incx);
           /* Swap vector X and Y */
           sswap_(&dim,X,&incx,Y,&incx);
-...
       for (i=0;i<RUNS;i++)
+        {
     #ifdef DOUBLE
     #ifdef FP64
           printVector(dim,X,"X","Roots");
-...
       for (i=0;i<RUNS;i++)
+        {
     #ifdef DOUBLE
     #ifdef FP64
           printVector(dim,X,"X","Roots");
-...
       for (i=0;i<RUNS;i++)
+        {
     #ifdef DOUBLE
     #ifdef FP64
           printVector(dim,X,"X","Roots");

Formats disponibles : Unified diff

Centre Blaise Pascal » Bench4GPU

Révision 251