/NBody/NBody.py - Annoter - Bench4GPU - Forge du Centre Blaise Pascal

root / NBody / NBody.py @ 226

Historique | Voir | Annoter | Télécharger (29,02 ko)

-equemene
+#!/usr/bin/env python3
-equemene
+# -*- coding: utf-8 -*-
-equemene
+"""
-equemene
+NBody Demonstrator implemented in OpenCL, rendering OpenGL
 equemene
-equemene
+CC BY-NC-SA 2011 : Emmanuel QUEMENER <emmanuel.quemener@gmail.com>
-equemene
+Cecill v2 : Emmanuel QUEMENER <emmanuel.quemener@gmail.com>
 equemene
-equemene
+Thanks to Andreas Klockner for PyOpenCL:
-equemene
+http://mathema.tician.de/software/pyopencl
 equemene
-equemene
+"""
-equemene
+import getopt
-equemene
+import sys
-equemene
+import time
-equemene
+import numpy as np
-equemene
+import pyopencl as cl
-equemene
+import pyopencl.array as cl_array
-equemene
+from numpy.random import randint as nprnd
-equemene
+import string, sys
-equemene
+from OpenGL.GL import *
-equemene
+from OpenGL.GLUT import *
 equemene
-equemene
+def DictionariesAPI():
-equemene
+    Marsaglia={'CONG':0,'SHR3':1,'MWC':2,'KISS':3}
-equemene
+    Computing={'FP32':0,'FP64':1}
-equemene
+    Interaction={'Force':0,'Potential':1}
-equemene
+    Artevasion={'None':0,'NegExp':1,'CorRad':2}
-equemene
+    return(Marsaglia,Computing,Interaction,Artevasion)
 equemene
-equemene
+BlobOpenCL= """
-equemene
+#define TFP32 0
-equemene
+#define TFP64 1
 equemene
-equemene
+#define TFORCE 0
-equemene
+#define TPOTENTIAL 1
 equemene
-equemene
+#define NONE 0
-equemene
+#define NEGEXP 1
-equemene
+#define CORRAD 2
 equemene
-equemene
+#if TYPE == TFP32
-equemene
+#define MYFLOAT4 float4
-equemene
+#define MYFLOAT8 float8
-equemene
+#define MYFLOAT float
-equemene
+#define DISTANCE fast_distance
-equemene
+#else
-equemene
+#define MYFLOAT4 double4
-equemene
+#define MYFLOAT8 double8
-equemene
+#define MYFLOAT double
-equemene
+#define DISTANCE distance
-equemene
+#if defined(cl_khr_fp64)  // Khronos extension available?
-equemene
+#pragma OPENCL EXTENSION cl_khr_fp64 : enable
-equemene
+#endif
-equemene
+#endif
 equemene
-equemene
+#define znew  ((zmwc=36969*(zmwc&65535)+(zmwc>>16))<<16)
-equemene
+#define wnew  ((wmwc=18000*(wmwc&65535)+(wmwc>>16))&65535)
-equemene
+#define MWC   (znew+wnew)
-equemene
+#define SHR3  (jsr=(jsr=(jsr=jsr^(jsr<<17))^(jsr>>13))^(jsr<<5))
-equemene
+#define CONG  (jcong=69069*jcong+1234567)
-equemene
+#define KISS  ((MWC^CONG)+SHR3)
 equemene
-equemene
+#define MWCfp (MYFLOAT)(MWC * 2.3283064365386963e-10f)
-equemene
+#define KISSfp (MYFLOAT)(KISS * 2.3283064365386963e-10f)
-equemene
+#define SHR3fp (MYFLOAT)(SHR3 * 2.3283064365386963e-10f)
-equemene
+#define CONGfp (MYFLOAT)(CONG * 2.3283064365386963e-10f)
 equemene
-equemene
+#define PI (MYFLOAT)3.141592653589793238e0f
 equemene
-equemene
+#define SMALL_NUM (MYFLOAT)1.e-9f
 equemene
-equemene
+#define CoreRadius (MYFLOAT)(1.e0f)
 equemene
-equemene
+// Create my own Distance implementation: distance buggy on Oland AMD chipset
 equemene
-equemene
+MYFLOAT MyDistance(MYFLOAT4 n,MYFLOAT4 m)
 equemene
-equemene
+    private MYFLOAT x2,y2,z2;
-equemene
+    x2=n.s0-m.s0;
-equemene
+    x2*=x2;
-equemene
+    y2=n.s1-m.s1;
-equemene
+    y2*=y2;
-equemene
+    z2=n.s2-m.s2;
-equemene
+    z2*=z2;
-equemene
+    return(sqrt(x2+y2+z2));
 equemene
 equemene
-equemene
+// Potential between 2 m,n bodies
-equemene
+MYFLOAT PairPotential(MYFLOAT4 m,MYFLOAT4 n)
-equemene
+#if ARTEVASION == NEGEXP
-equemene
+// Add exp(-r) to numerator to avoid divergence for low distances
 equemene
-equemene
+    MYFLOAT r=DISTANCE(n,m);
-equemene
+    return((-1.e0f+exp(-r))/r);
 equemene
-equemene
+#elif ARTEVASION == CORRAD
-equemene
+// Add Core Radius to avoid divergence for low distances
 equemene
-equemene
+    MYFLOAT r=DISTANCE(n,m);
-equemene
+    return(-1.e0f/sqrt(r*r+CoreRadius*CoreRadius));
 equemene
-equemene
+#else
-equemene
+// Classical potential in 1/r
 equemene
-equemene
+//    return((MYFLOAT)(-1.e0f)/(MyDistance(m,n)));
-equemene
+    return((MYFLOAT)(-1.e0f)/(DISTANCE(n,m)));
 equemene
-equemene
+#endif
 equemene
-equemene
+// Interaction based of Force as gradient of Potential
-equemene
+MYFLOAT4 Interaction(MYFLOAT4 m,MYFLOAT4 n)
-equemene
+#if INTERACTION == TFORCE
-equemene
+#if ARTEVASION == NEGEXP
-equemene
+// Force gradient of potential, set as (1-exp(-r))/r
 equemene
-equemene
+    private MYFLOAT r=MyDistance(n,m);
-equemene
+    private MYFLOAT num=1.e0f+exp(-r)*(r-1.e0f);
-equemene
+    return((n-m)*num/(MYFLOAT)(r*r*r));
 equemene
-equemene
+#elif ARTEVASION == CORRAD
-equemene
+// Force gradient of potential, (Core Radius) set as 1/sqrt(r**2+CoreRadius**2)
 equemene
-equemene
+    private MYFLOAT r=MyDistance(n,m);
-equemene
+    private MYFLOAT den=sqrt(r*r+CoreRadius*CoreRadius);
-equemene
+    return((n-m)/(MYFLOAT)(den*den*den));
 equemene
-equemene
+#else
-equemene
+// Simplest implementation of force (equals to acceleration)
-equemene
+// seems to bo bad (numerous artevasions)
-equemene
+// MYFLOAT4 InteractionForce(MYFLOAT4 m,MYFLOAT4 n)
 equemene
-equemene
+    private MYFLOAT r=MyDistance(n,m);
-equemene
+    return((n-m)/(MYFLOAT)(r*r*r));
 equemene
-equemene
+#endif
-equemene
+#else
-equemene
+// Force definited as gradient of potential
-equemene
+// Estimate potential and proximate potential to estimate force
 equemene
-equemene
+    // 1/1024 seems to be a good factor: larger one provides bad results
-equemene
+    private MYFLOAT epsilon=(MYFLOAT)(1.e0f/1024);
-equemene
+    private MYFLOAT4 er=normalize(n-m);
-equemene
+    private MYFLOAT4 dr=er*(MYFLOAT)epsilon;
 equemene
-equemene
+    return(er/epsilon*(PairPotential(m,n)-PairPotential(m+dr,n)));
 equemene
-equemene
+#endif
 equemene
-equemene
+MYFLOAT AtomicPotential(__global MYFLOAT4* clDataX,int gid)
 equemene
-equemene
+    private MYFLOAT potential=(MYFLOAT)0.e0f;
-equemene
+    private MYFLOAT4 x=clDataX[gid];
 equemene
-equemene
+    for (int i=0;i<get_global_size(0);i++)
 equemene
-equemene
+        if (gid != i)
-equemene
+        potential+=PairPotential(x,clDataX[i]);
 equemene
 equemene
-equemene
+    barrier(CLK_GLOBAL_MEM_FENCE);
-equemene
+    return(potential);
 equemene
 equemene
-equemene
+MYFLOAT AtomicPotentialCoM(__global MYFLOAT4* clDataX,__global MYFLOAT4* clCoM,int gid)
 equemene
-equemene
+    return(PairPotential(clDataX[gid],clCoM[0]));
 equemene
 equemene
-equemene
+// Elements from : http://doswa.com/2009/01/02/fourth-order-runge-kutta-numerical-integration.html
 equemene
-equemene
+MYFLOAT8 AtomicRungeKutta(__global MYFLOAT4* clDataInX,__global MYFLOAT4* clDataInV,int gid,MYFLOAT dt)
 equemene
-equemene
+    private MYFLOAT4 a0,v0,x0,a1,v1,x1,a2,v2,x2,a3,v3,x3,a4,v4,x4,xf,vf;
-equemene
+    MYFLOAT4 DT=dt*(MYFLOAT4)(1.e0f,1.e0f,1.e0f,1.e0f);
 equemene
-equemene
+    a0=(MYFLOAT4)(0.e0f,0.e0f,0.e0f,0.e0f);
-equemene
+    v0=(MYFLOAT4)clDataInV[gid];
-equemene
+    x0=(MYFLOAT4)clDataInX[gid];
-equemene
+    int N = get_global_size(0);
 equemene
-equemene
+    for (private int i=0;i<N;i++)
 equemene
-equemene
+        if (gid != i)
-equemene
+        a0+=Interaction(x0,clDataInX[i]);
 equemene
 equemene
-equemene
+    a1=(MYFLOAT4)(0.e0f,0.e0f,0.e0f,0.e0f);
-equemene
+    v1=a0*dt+v0;
-equemene
+    x1=v0*dt+x0;
-equemene
+    for (private int j=0;j<N;j++)
 equemene
-equemene
+        if (gid != j)
-equemene
+        a1+=Interaction(x1,clDataInX[j]);
 equemene
 equemene
-equemene
+    a2=(MYFLOAT4)(0.e0f,0.e0f,0.e0f,0.e0f);
-equemene
+    v2=a1*(MYFLOAT)(dt/2.e0f)+v0;
-equemene
+    x2=v1*(MYFLOAT)(dt/2.e0f)+x0;
-equemene
+    for (private int k=0;k<N;k++)
 equemene
-equemene
+        if (gid != k)
-equemene
+        a2+=Interaction(x2,clDataInX[k]);
 equemene
 equemene
-equemene
+    a3=(MYFLOAT4)(0.e0f,0.e0f,0.e0f,0.e0f);
-equemene
+    v3=a2*(MYFLOAT)(dt/2.e0f)+v0;
-equemene
+    x3=v2*(MYFLOAT)(dt/2.e0f)+x0;
-equemene
+    for (private int l=0;l<N;l++)
 equemene
-equemene
+        if (gid != l)
-equemene
+        a3+=Interaction(x3,clDataInX[l]);
 equemene
 equemene
-equemene
+    a4=(MYFLOAT4)(0.e0f,0.e0f,0.e0f,0.e0f);
-equemene
+    v4=a3*dt+v0;
-equemene
+    x4=v3*dt+x0;
-equemene
+    for (private int m=0;m<N;m++)
 equemene
-equemene
+        if (gid != m)
-equemene
+        a4+=Interaction(x4,clDataInX[m]);
 equemene
 equemene
-equemene
+    xf=x0+dt*(v1+(MYFLOAT)2.e0f*(v2+v3)+v4)/(MYFLOAT)6.e0f;
-equemene
+    vf=v0+dt*(a1+(MYFLOAT)2.e0f*(a2+a3)+a4)/(MYFLOAT)6.e0f;
 equemene
-equemene
+    return((MYFLOAT8)(xf.s0,xf.s1,xf.s2,0.e0f,vf.s0,vf.s1,vf.s2,0.e0f));
 equemene
 equemene
-equemene
+MYFLOAT8 AtomicHeun(__global MYFLOAT4* clDataInX,__global MYFLOAT4* clDataInV,int gid,MYFLOAT dt)
 equemene
-equemene
+    private MYFLOAT4 x0,v0,a0,x1,v1,a1,xf,vf;
-equemene
+    MYFLOAT4 Dt=dt*(MYFLOAT4)(1.e0f,1.e0f,1.e0f,1.e0f);
 equemene
-equemene
+    x0=(MYFLOAT4)clDataInX[gid];
-equemene
+    v0=(MYFLOAT4)clDataInV[gid];
-equemene
+    a0=(MYFLOAT4)(0.e0f,0.e0f,0.e0f,0.e0f);
 equemene
-equemene
+    for (private int i=0;i<get_global_size(0);i++)
 equemene
-equemene
+        if (gid != i)
-equemene
+        a0+=Interaction(x0,clDataInX[i]);
 equemene
 equemene
-equemene
+    a1=(MYFLOAT4)(0.e0f,0.e0f,0.e0f,0.e0f);
-equemene
+    //v1=v0+dt*a0;
-equemene
+    //x1=x0+dt*v0;
-equemene
+    v1=dt*a0+v0;
-equemene
+    x1=dt*v0+x0;
 equemene
-equemene
+    for (private int j=0;j<get_global_size(0);j++)
 equemene
-equemene
+        if (gid != j)
-equemene
+        a1+=Interaction(x1,clDataInX[j]);
 equemene
 equemene
-equemene
+    vf=v0+dt*(a0+a1)/(MYFLOAT)2.e0f;
-equemene
+    xf=x0+dt*(v0+v1)/(MYFLOAT)2.e0f;
 equemene
-equemene
+    return((MYFLOAT8)(xf.s0,xf.s1,xf.s2,0.e0f,vf.s0,vf.s1,vf.s2,0.e0f));
 equemene
 equemene
-equemene
+MYFLOAT8 AtomicImplicitEuler(__global MYFLOAT4* clDataInX,__global MYFLOAT4* clDataInV,int gid,MYFLOAT dt)
 equemene
-equemene
+    MYFLOAT4 x0,v0,a,xf,vf;
 equemene
-equemene
+    x0=(MYFLOAT4)clDataInX[gid];
-equemene
+    v0=(MYFLOAT4)clDataInV[gid];
-equemene
+    a=(MYFLOAT4)(0.e0f,0.e0f,0.e0f,0.e0f);
 equemene
-equemene
+    for (private int i=0;i<get_global_size(0);i++)
 equemene
-equemene
+        if (gid != i)
-equemene
+          a+=Interaction(x0,clDataInX[i]);
 equemene
 equemene
-equemene
+    vf=v0+dt*a;
-equemene
+    xf=x0+dt*vf;
 equemene
-equemene
+    return((MYFLOAT8)(xf.s0,xf.s1,xf.s2,0.e0f,vf.s0,vf.s1,vf.s2,0.e0f));
 equemene
 equemene
-equemene
+MYFLOAT8 AtomicExplicitEuler(__global MYFLOAT4* clDataInX,__global MYFLOAT4* clDataInV,int gid,MYFLOAT dt)
 equemene
-equemene
+    MYFLOAT4 x0,v0,a,xf,vf;
 equemene
-equemene
+    x0=(MYFLOAT4)clDataInX[gid];
-equemene
+    v0=(MYFLOAT4)clDataInV[gid];
-equemene
+    a=(MYFLOAT4)(0.e0f,0.e0f,0.e0f,0.e0f);
 equemene
-equemene
+    for (private int i=0;i<get_global_size(0);i++)
 equemene
-equemene
+        if (gid != i)
-equemene
+        a+=Interaction(x0,clDataInX[i]);
 equemene
 equemene
-equemene
+    vf=v0+dt*a;
-equemene
+    xf=x0+dt*v0;
 equemene
-equemene
+    return((MYFLOAT8)(xf.s0,xf.s1,xf.s2,0.e0f,vf.s0,vf.s1,vf.s2,0.e0f));
 equemene
 equemene
-equemene
+__kernel void InBallSplutterPoints(__global MYFLOAT4* clDataX,
-equemene
+                                   MYFLOAT diameter,uint seed_z,uint seed_w)
 equemene
-equemene
+    private int gid=get_global_id(0);
-equemene
+    private uint zmwc=seed_z+gid;
-equemene
+    private uint wmwc=seed_w+(gid+1)%2;
-equemene
+    private MYFLOAT Heat;
 equemene
-equemene
+    for (int i=0;i<gid;i++)
 equemene
-equemene
+        Heat=MWCfp;
 equemene
 equemene
-equemene
+// More accurate distribution based on spherical coordonates
-equemene
+// Disactivated because of AMD Oland GPU crash on launch
-equemene
+//     private MYFLOAT Radius,Theta,Phi,PosX,PosY,PosZ,SinTheta;
-equemene
+//     Radius=MWCfp*diameter/2.e0f;
-equemene
+//     Theta=(MYFLOAT)acos((float)(-2.e0f*MWCfp+1.0e0f));
-equemene
+//     Phi=(MYFLOAT)(2.e0f*PI*MWCfp);
-equemene
+//     SinTheta=sin((float)Theta);
-equemene
+//     PosX=cos((float)Phi)*Radius*SinTheta;
-equemene
+//     PosY=sin((float)Phi)*Radius*SinTheta;
-equemene
+//     PosZ=cos((float)Theta)*Radius;
-equemene
+//     clDataX[gid]=(MYFLOAT4)(PosX,PosY,PosZ,0.e0f);
 equemene
-equemene
+    private MYFLOAT Radius=diameter/2.e0f;
-equemene
+    private MYFLOAT Length=diameter;
-equemene
+    private MYFLOAT4 Position;
-equemene
+    while (Length>Radius) {
-equemene
+       Position=(MYFLOAT4)((MWCfp-0.5e0f)*diameter,(MWCfp-0.5e0f)*diameter,(MWCfp-0.5e0f)*diameter,0.e0f);
-equemene
+       Length=(MYFLOAT)length((MYFLOAT4)Position);
 equemene
 equemene
-equemene
+    clDataX[gid]=Position;
 equemene
-equemene
+    barrier(CLK_GLOBAL_MEM_FENCE);
 equemene
 equemene
-equemene
+__kernel void InBoxSplutterPoints(__global MYFLOAT4* clDataX, MYFLOAT box,
-equemene
+                             uint seed_z,uint seed_w)
 equemene
-equemene
+    int gid=get_global_id(0);
-equemene
+    uint zmwc=seed_z+gid;
-equemene
+    uint wmwc=seed_w-gid;
-equemene
+    private MYFLOAT Heat;
 equemene
-equemene
+    for (int i=0;i<gid;i++)
 equemene
-equemene
+        Heat=MWCfp;
 equemene
 equemene
-equemene
+    clDataX[gid]=(MYFLOAT4)((MWCfp-0.5e0f)*box,(MWCfp-0.5e0f)*box,(MWCfp-0.5e0f)*box,0.e0f);
 equemene
-equemene
+    barrier(CLK_GLOBAL_MEM_FENCE);
 equemene
 equemene
-equemene
+__kernel void SplutterStress(__global MYFLOAT4* clDataX,__global MYFLOAT4* clDataV,__global MYFLOAT4* clCoM, MYFLOAT velocity,uint seed_z,uint seed_w)
 equemene
-equemene
+    int gid = get_global_id(0);
-equemene
+    MYFLOAT N = (MYFLOAT)get_global_size(0);
-equemene
+    uint zmwc=seed_z+(uint)gid;
-equemene
+    uint wmwc=seed_w-(uint)gid;
-equemene
+    MYFLOAT4 CrossVector,SpeedVector,FromCoM;
-equemene
+    MYFLOAT Heat,ThetaA,PhiA,ThetaB,PhiB,Length,tA,tB,Polar;
 equemene
-equemene
+    for (int i=0;i<gid;i++)
 equemene
-equemene
+        Heat=MWCfp;
 equemene
 equemene
-equemene
+    // cast to float for sin,cos are NEEDED by Mesa FP64 implementation!
-equemene
+    // Implemention on AMD Oland are probably broken in float
 equemene
-equemene
+    FromCoM=(MYFLOAT4)(clDataX[gid]-clCoM[0]);
-equemene
+    Length=length(FromCoM);
-equemene
+    //Theta=acos(FromCoM.z/Length);
-equemene
+    //Phi=atan(FromCoM.y/FromCoM.x);
-equemene
+    // First tangential vector to sphere of length radius
-equemene
+    ThetaA=acos(FromCoM.x/Length)+5.e-1f*PI;
-equemene
+    PhiA=atan(FromCoM.y/FromCoM.z);
-equemene
+    // Second tangential vector to sphere of length radius
-equemene
+    ThetaB=acos((float)(FromCoM.x/Length));
-equemene
+    PhiB=atan((float)(FromCoM.y/FromCoM.z))+5.e-1f*PI;
-equemene
+    // (x,y) random coordonates to plane tangential to sphere
-equemene
+    Polar=MWCfp*2.e0f*PI;
-equemene
+    tA=cos((float)Polar);
-equemene
+    tB=sin((float)Polar);
 equemene
-equemene
+    // Exception for 2 particules to ovoid shifting
-equemene
+    if (get_global_size(0)==2) {
-equemene
+       CrossVector=(MYFLOAT4)(1.e0f,1.e0f,1.e0f,0.e0f);
-equemene
+    } else {
-equemene
+       CrossVector.s0=tA*cos((float)ThetaA)+tB*cos((float)ThetaB);
-equemene
+       CrossVector.s1=tA*sin((float)ThetaA)*sin((float)PhiA)+tB*sin((float)ThetaB)*sin((float)PhiB);
-equemene
+       CrossVector.s2=tA*sin((float)ThetaA)*cos((float)PhiA)+tB*sin((float)ThetaB)*cos((float)PhiB);
-equemene
+       CrossVector.s3=0.e0f;
 equemene
 equemene
-equemene
+    if (velocity<SMALL_NUM) {
-equemene
+       SpeedVector=(MYFLOAT4)normalize(cross(FromCoM,CrossVector))*sqrt((-AtomicPotential(clDataX,gid)/(MYFLOAT)2.e0f));
 equemene
-equemene
+    else
 equemene
 equemene
-equemene
+       SpeedVector=(MYFLOAT4)((MWCfp-5e-1f)*velocity,(MWCfp-5e-1f)*velocity,
-equemene
+                              (MWCfp-5e-1f)*velocity,0.e0f);
 equemene
-equemene
+    clDataV[gid]=SpeedVector;
-equemene
+    barrier(CLK_GLOBAL_MEM_FENCE);
 equemene
 equemene
-equemene
+__kernel void RungeKutta(__global MYFLOAT4* clDataX,__global MYFLOAT4* clDataV,MYFLOAT h)
 equemene
-equemene
+    private int gid = get_global_id(0);
-equemene
+    private MYFLOAT8 clDataGid;
 equemene
-equemene
+    clDataGid=AtomicRungeKutta(clDataX,clDataV,gid,h);
-equemene
+    barrier(CLK_GLOBAL_MEM_FENCE);
-equemene
+    clDataX[gid]=clDataGid.s0123;
-equemene
+    clDataV[gid]=clDataGid.s4567;
 equemene
 equemene
-equemene
+__kernel void Heun(__global MYFLOAT4* clDataX,__global MYFLOAT4* clDataV,MYFLOAT h)
 equemene
-equemene
+    private int gid = get_global_id(0);
-equemene
+    private MYFLOAT8 clDataGid;
 equemene
-equemene
+    clDataGid=AtomicHeun(clDataX,clDataV,gid,h);
-equemene
+    barrier(CLK_GLOBAL_MEM_FENCE);
-equemene
+    clDataX[gid]=clDataGid.s0123;
-equemene
+    clDataV[gid]=clDataGid.s4567;
 equemene
 equemene
-equemene
+__kernel void ImplicitEuler(__global MYFLOAT4* clDataX,__global MYFLOAT4* clDataV,MYFLOAT h)
 equemene
-equemene
+    private int gid = get_global_id(0);
-equemene
+    private MYFLOAT8 clDataGid;
 equemene
-equemene
+    clDataGid=AtomicImplicitEuler(clDataX,clDataV,gid,h);
-equemene
+    barrier(CLK_GLOBAL_MEM_FENCE);
-equemene
+    clDataX[gid]=clDataGid.s0123;
-equemene
+    clDataV[gid]=clDataGid.s4567;
 equemene
 equemene
-equemene
+__kernel void ExplicitEuler(__global MYFLOAT4* clDataX,__global MYFLOAT4* clDataV,MYFLOAT h)
 equemene
-equemene
+    private int gid = get_global_id(0);
-equemene
+    private MYFLOAT8 clDataGid;
 equemene
-equemene
+    clDataGid=AtomicExplicitEuler(clDataX,clDataV,gid,h);
-equemene
+    barrier(CLK_GLOBAL_MEM_FENCE);
-equemene
+    clDataX[gid]=clDataGid.s0123;
-equemene
+    clDataV[gid]=clDataGid.s4567;
 equemene
 equemene
-equemene
+__kernel void CoMPotential(__global MYFLOAT4* clDataX,__global MYFLOAT4* clCoM,__global MYFLOAT* clPotential)
 equemene
-equemene
+    int gid = get_global_id(0);
 equemene
-equemene
+    clPotential[gid]=PairPotential(clDataX[gid],clCoM[0]);
 equemene
 equemene
-equemene
+__kernel void Potential(__global MYFLOAT4* clDataX,__global MYFLOAT* clPotential)
 equemene
-equemene
+    int gid = get_global_id(0);
 equemene
-equemene
+    MYFLOAT potential=(MYFLOAT)0.e0f;
-equemene
+    MYFLOAT4 x=clDataX[gid];
 equemene
-equemene
+    for (int i=0;i<get_global_size(0);i++)
 equemene
-equemene
+        if (gid != i)
-equemene
+        potential+=PairPotential(x,clDataX[i]);
 equemene
 equemene
-equemene
+    barrier(CLK_GLOBAL_MEM_FENCE);
-equemene
+    clPotential[gid]=potential*(MYFLOAT)5.e-1f;
 equemene
 equemene
-equemene
+__kernel void CenterOfMass(__global MYFLOAT4* clDataX,__global MYFLOAT4* clCoM,int Size)
 equemene
-equemene
+    MYFLOAT4 CoM=clDataX[0];
 equemene
-equemene
+    for (int i=1;i<Size;i++)
 equemene
-equemene
+        CoM+=clDataX[i];
 equemene
 equemene
-equemene
+    barrier(CLK_GLOBAL_MEM_FENCE);
-equemene
+    clCoM[0]=(MYFLOAT4)(CoM.s0,CoM.s1,CoM.s2,0.e0f)/(MYFLOAT)Size;
 equemene
 equemene
-equemene
+__kernel void Kinetic(__global MYFLOAT4* clDataV,__global MYFLOAT* clKinetic)
 equemene
-equemene
+    int gid = get_global_id(0);
 equemene
-equemene
+    barrier(CLK_GLOBAL_MEM_FENCE);
-equemene
+    MYFLOAT d=(MYFLOAT)length(clDataV[gid]);
-equemene
+    clKinetic[gid]=(MYFLOAT)5.e-1f*(MYFLOAT)(d*d);
 equemene
 equemene
-equemene
+"""
 equemene
-equemene
+def MainOpenCL(clDataX,clDataV,Step,Method):
-equemene
+    time_start=time.time()
-equemene
+    if Method=="RungeKutta":
-equemene
+        CLLaunch=MyRoutines.RungeKutta(queue,(Number,1),None,clDataX,clDataV,Step)
-equemene
+    elif Method=="ExplicitEuler":
-equemene
+        CLLaunch=MyRoutines.ExplicitEuler(queue,(Number,1),None,clDataX,clDataV,Step)
-equemene
+    elif Method=="Heun":
-equemene
+        CLLaunch=MyRoutines.Heun(queue,(Number,1),None,clDataX,clDataV,Step)
-equemene
+    else:
-equemene
+        CLLaunch=MyRoutines.ImplicitEuler(queue,(Number,1),None,clDataX,clDataV,Step)
-equemene
+    CLLaunch.wait()
-equemene
+    Elapsed=time.time()-time_start
-equemene
+    return(Elapsed)
 equemene
-equemene
+def display(*args):
 equemene
-equemene
+    global MyDataX,MyDataV,clDataX,clDataV,Step,Method,Number,Iterations,Durations,Verbose,SpeedRendering
 equemene
-equemene
+    glClearColor(0.0, 0.0, 0.0, 0.0)
-equemene
+    glClear(GL_COLOR_BUFFER_BIT)
-equemene
+    glColor3f(1.0,1.0,1.0)
 equemene
-equemene
+    Elapsed=MainOpenCL(clDataX,clDataV,Step,Method)
-equemene
+    if SpeedRendering:
-equemene
+        cl.enqueue_copy(queue, MyDataV, clDataV)
-equemene
+        MyDataV.reshape(Number,4)[:,3]=1
-equemene
+        glVertexPointerf(MyDataV.reshape(Number,4))
-equemene
+    else:
-equemene
+        cl.enqueue_copy(queue, MyDataX, clDataX)
-equemene
+        MyDataX.reshape(Number,4)[:,3]=1
-equemene
+        glVertexPointerf(MyDataX.reshape(Number,4))
 equemene
-equemene
+    if Verbose:
-equemene
+        print("Positions for #%s iteration: %s" % (Iterations,MyDataX))
-equemene
+    else:
-equemene
+        sys.stdout.write('.')
-equemene
+        sys.stdout.flush()
-equemene
+    Durations=np.append(Durations,MainOpenCL(clDataX,clDataV,Step,Method))
-equemene
+    glEnableClientState(GL_VERTEX_ARRAY)
-equemene
+    glDrawArrays(GL_POINTS, 0, Number)
-equemene
+    glDisableClientState(GL_VERTEX_ARRAY)
-equemene
+    glFlush()
-equemene
+    Iterations+=1
-equemene
+    glutSwapBuffers()
 equemene
-equemene
+def halt():
-equemene
+    pass
 equemene
-equemene
+def keyboard(k,x,y):
-equemene
+    global ViewRZ,SpeedRendering
-equemene
+    LC_Z = as_8_bit( 'z' )
-equemene
+    UC_Z = as_8_bit( 'Z' )
-equemene
+    Plus = as_8_bit( '+' )
-equemene
+    Minus = as_8_bit( '-' )
-equemene
+    Switch = as_8_bit( 's' )
 equemene
-equemene
+    Zoom=1
-equemene
+    if k == LC_Z:
-equemene
+        ViewRZ += 1.0
-equemene
+    elif k == UC_Z:
-equemene
+        ViewRZ -= 1.0
-equemene
+    elif k == Plus:
-equemene
+        Zoom *= 2.0
-equemene
+    elif k == Minus:
-equemene
+        Zoom /= 2.0
-equemene
+    elif k == Switch:
-equemene
+        if SpeedRendering:
-equemene
+            SpeedRendering=False
-equemene
+        else:
-equemene
+            SpeedRendering=True
-equemene
+    elif ord(k) == 27: # Escape
-equemene
+        glutLeaveMainLoop()
-equemene
+        return(False)
-equemene
+    else:
-equemene
+        return
-equemene
+    glRotatef(ViewRZ, 0.0, 0.0, 1.0)
-equemene
+    glScalef(Zoom,Zoom,Zoom)
-equemene
+    glutPostRedisplay()
 equemene
-equemene
+def special(k,x,y):
-equemene
+    global ViewRX, ViewRY
 equemene
-equemene
+    Step=1.
-equemene
+    if k == GLUT_KEY_UP:
-equemene
+        ViewRX += Step
-equemene
+    elif k == GLUT_KEY_DOWN:
-equemene
+        ViewRX -= Step
-equemene
+    elif k == GLUT_KEY_LEFT:
-equemene
+        ViewRY += Step
-equemene
+    elif k == GLUT_KEY_RIGHT:
-equemene
+        ViewRY -= Step
-equemene
+    else:
-equemene
+        return
-equemene
+    glRotatef(ViewRX, 1.0, 0.0, 0.0)
-equemene
+    glRotatef(ViewRY, 0.0, 1.0, 0.0)
-equemene
+    glutPostRedisplay()
 equemene
-equemene
+def setup_viewport():
-equemene
+    global SizeOfBox
-equemene
+    glMatrixMode(GL_PROJECTION)
-equemene
+    glLoadIdentity()
-equemene
+    glOrtho(-SizeOfBox, SizeOfBox, -SizeOfBox, SizeOfBox, -SizeOfBox, SizeOfBox)
-equemene
+    glutPostRedisplay()
 equemene
-equemene
+def reshape(w, h):
-equemene
+    glViewport(0, 0, w, h)
-equemene
+    setup_viewport()
 equemene
-equemene
+if __name__=='__main__':
 equemene
-equemene
+    global Number,Step,clDataX,clDataV,MyDataX,MyDataV,Method,SizeOfBox,Iterations,Verbose,Durations
 equemene
-equemene
+    # ValueType
-equemene
+    ValueType='FP32'
-equemene
+    class MyFloat(np.float32):pass
-equemene
+    #    clType8=cl_array.vec.float8
-equemene
+    # Set defaults values
-equemene
+    np.set_printoptions(precision=2)
-equemene
+    # Id of Device : 1 is for first find !
-equemene
+    Device=0
-equemene
+    # Number of bodies is integer
-equemene
+    Number=2
-equemene
+    # Number of iterations (for standalone execution)
-equemene
+    Iterations=10
-equemene
+    # Size of shape
-equemene
+    SizeOfShape=MyFloat(1.)
-equemene
+    # Initial velocity of particules
-equemene
+    Velocity=MyFloat(1.)
-equemene
+    # Step
-equemene
+    Step=MyFloat(1./32)
-equemene
+    # Method of integration
-equemene
+    Method='ImplicitEuler'
-equemene
+    # InitialRandom
-equemene
+    InitialRandom=False
-equemene
+    # RNG Marsaglia Method
-equemene
+    RNG='MWC'
-equemene
+    # Viriel Distribution of stress
-equemene
+    VirielStress=True
-equemene
+    # Verbose
-equemene
+    Verbose=False
-equemene
+    # OpenGL real time rendering
-equemene
+    OpenGL=False
-equemene
+    # Speed rendering
-equemene
+    SpeedRendering=False
-equemene
+    # Counter ArtEvasions Measures (artefact evasion)
-equemene
+    CoArEv='None'
-equemene
+    # Shape to distribute
-equemene
+    Shape='Ball'
-equemene
+    # Type of Interaction
-equemene
+    InterType='Force'
 equemene
-equemene
+    HowToUse='%s -h [Help] -r [InitialRandom] -g [OpenGL] -e [VirielStress] -o [Verbose] -p [Potential] -x <None|NegExp|CorRad> -d <DeviceId> -n <NumberOfParticules> -i <Iterations> -z <SizeOfBoxOrBall> -v <Velocity> -s <Step> -b <Ball|Box> -m <ImplicitEuler|RungeKutta|ExplicitEuler|Heun> -t <FP32|FP64>'
 equemene
-equemene
+    try:
-equemene
+        opts, args = getopt.getopt(sys.argv[1:],"rpgehod:n:i:z:v:s:m:t:b:x:",["random","potential","coarev","opengl","viriel","verbose","device=","number=","iterations=","size=","velocity=","step=","method=","valuetype=","shape="])
-equemene
+    except getopt.GetoptError:
-equemene
+        print(HowToUse % sys.argv[0])
-equemene
+        sys.exit(2)
 equemene
-equemene
+    for opt, arg in opts:
-equemene
+        if opt == '-h':
-equemene
+            print(HowToUse % sys.argv[0])
 equemene
-equemene
+            print("\nInformations about devices detected under OpenCL:")
-equemene
+            try:
-equemene
+                Id=0
-equemene
+                for platform in cl.get_platforms():
-equemene
+                    for device in platform.get_devices():
-equemene
+                        # Failed now because of POCL implementation
-equemene
+                        #deviceType=cl.device_type.to_string(device.type)
-equemene
+                        deviceType="xPU"
-equemene
+                        print("Device #%i from %s of type %s : %s" % (Id,platform.vendor.lstrip(),deviceType,device.name.lstrip()))
-equemene
+                        Id=Id+1
-equemene
+                sys.exit()
-equemene
+            except ImportError:
-equemene
+                print("Your platform does not seem to support OpenCL")
-equemene
+                sys.exit()
 equemene
-equemene
+        elif opt in ("-t", "--valuetype"):
-equemene
+            if arg=='FP64':
-equemene
+                class MyFloat(np.float64): pass
-equemene
+            else:
-equemene
+                class MyFloat(np.float32):pass
-equemene
+            ValueType = arg
-equemene
+        elif opt in ("-d", "--device"):
-equemene
+            Device=int(arg)
-equemene
+        elif opt in ("-m", "--method"):
-equemene
+            Method=arg
-equemene
+        elif opt in ("-b", "--shape"):
-equemene
+            Shape=arg
-equemene
+            if Shape!='Ball' or Shape!='Box':
-equemene
+                print('Wrong argument: set to Ball')
-equemene
+        elif opt in ("-n", "--number"):
-equemene
+            Number=int(arg)
-equemene
+        elif opt in ("-i", "--iterations"):
-equemene
+            Iterations=int(arg)
-equemene
+        elif opt in ("-z", "--size"):
-equemene
+            SizeOfShape=MyFloat(arg)
-equemene
+        elif opt in ("-v", "--velocity"):
-equemene
+            Velocity=MyFloat(arg)
-equemene
+            VirielStress=False
-equemene
+        elif opt in ("-s", "--step"):
-equemene
+            Step=MyFloat(arg)
-equemene
+        elif opt in ("-r", "--random"):
-equemene
+            InitialRandom=True
-equemene
+        elif opt in ("-c", "--check"):
-equemene
+            CheckEnergies=True
-equemene
+        elif opt in ("-e", "--viriel"):
-equemene
+            VirielStress=True
-equemene
+        elif opt in ("-g", "--opengl"):
-equemene
+            OpenGL=True
-equemene
+        elif opt in ("-p", "--potential"):
-equemene
+            InterType='Potential'
-equemene
+        elif opt in ("-x", "--coarev"):
-equemene
+            CoArEv=arg
-equemene
+        elif opt in ("-o", "--verbose"):
-equemene
+            Verbose=True
 equemene
-equemene
+    SizeOfShape=np.sqrt(MyFloat(SizeOfShape*Number))
-equemene
+    Velocity=MyFloat(Velocity)
-equemene
+    Step=MyFloat(Step)
 equemene
-equemene
+    print("Device choosed : %s" % Device)
-equemene
+    print("Number of particules : %s" % Number)
-equemene
+    print("Size of Shape : %s" % SizeOfShape)
-equemene
+    print("Initial velocity : %s" % Velocity)
-equemene
+    print("Step of iteration : %s" % Step)
-equemene
+    print("Number of iterations : %s" % Iterations)
-equemene
+    print("Method of resolution : %s" % Method)
-equemene
+    print("Initial Random for RNG Seed : %s" % InitialRandom)
-equemene
+    print("ValueType is : %s" % ValueType)
-equemene
+    print("Viriel distribution of stress : %s" % VirielStress)
-equemene
+    print("OpenGL real time rendering : %s" % OpenGL)
-equemene
+    print("Speed rendering : %s" % SpeedRendering)
-equemene
+    print("Interaction type : %s" % InterType)
-equemene
+    print("Counter Artevasion type : %s" % CoArEv)
 equemene
-equemene
+    # Create Numpy array of CL vector with 8 FP32
-equemene
+    MyCoM = np.zeros(4,dtype=MyFloat)
-equemene
+    MyDataX = np.zeros(Number*4, dtype=MyFloat)
-equemene
+    MyDataV = np.zeros(Number*4, dtype=MyFloat)
-equemene
+    MyPotential = np.zeros(Number, dtype=MyFloat)
-equemene
+    MyKinetic = np.zeros(Number, dtype=MyFloat)
 equemene
-equemene
+    Marsaglia,Computing,Interaction,Artevasion=DictionariesAPI()
 equemene
-equemene
+    # Scan the OpenCL arrays
-equemene
+    Id=0
-equemene
+    HasXPU=False
-equemene
+    for platform in cl.get_platforms():
-equemene
+        for device in platform.get_devices():
-equemene
+            if Id==Device:
-equemene
+                PlatForm=platform
-equemene
+                XPU=device
-equemene
+                print("CPU/GPU selected: ",device.name.lstrip())
-equemene
+                print("Platform selected: ",platform.name)
-equemene
+                HasXPU=True
-equemene
+            Id+=1
 equemene
-equemene
+    if HasXPU==False:
-equemene
+        print("No XPU #%i found in all of %i devices, sorry..." % (Device,Id-1))
-equemene
+        sys.exit()
 equemene
-equemene
+    # Create Context
-equemene
+    try:
-equemene
+        ctx = cl.Context([XPU])
-equemene
+        queue = cl.CommandQueue(ctx,properties=cl.command_queue_properties.PROFILING_ENABLE)
-equemene
+    except:
-equemene
+        print("Crash during context creation")
 equemene
-equemene
+    # Build all routines used for the computing
 equemene
-equemene
+    #BuildOptions="-cl-mad-enable -cl-kernel-arg-info -cl-fast-relaxed-math -cl-std=CL1.2 -DTRNG=%i -DTYPE=%i" % (Marsaglia[RNG],Computing[ValueType])
-equemene
+    BuildOptions="-cl-mad-enable -cl-fast-relaxed-math -DTRNG=%i -DTYPE=%i -DINTERACTION=%i -DARTEVASION=%i" % (Marsaglia[RNG],Computing[ValueType],Interaction[InterType],Artevasion[CoArEv])
 equemene
-equemene
+    if 'Intel' in PlatForm.name or 'Experimental' in PlatForm.name or 'Clover' in PlatForm.name or 'Portable' in PlatForm.name :
-equemene
+        MyRoutines = cl.Program(ctx, BlobOpenCL).build(options = BuildOptions)
-equemene
+    else:
-equemene
+        MyRoutines = cl.Program(ctx, BlobOpenCL).build(options = BuildOptions+" -cl-strict-aliasing")
 equemene
-equemene
+    mf = cl.mem_flags
-equemene
+    # Read/Write approach for buffering
-equemene
+    clDataX = cl.Buffer(ctx, mf.READ_WRITE, MyDataX.nbytes)
-equemene
+    clDataV = cl.Buffer(ctx, mf.READ_WRITE, MyDataV.nbytes)
-equemene
+    clPotential = cl.Buffer(ctx, mf.READ_WRITE, MyPotential.nbytes)
-equemene
+    clKinetic = cl.Buffer(ctx, mf.READ_WRITE, MyKinetic.nbytes)
-equemene
+    clCoM = cl.Buffer(ctx, mf.READ_WRITE, MyCoM.nbytes)
 equemene
-equemene
+    # Write/HostPointer approach for buffering
-equemene
+    # clDataX = cl.Buffer(ctx, mf.WRITE_ONLY|mf.COPY_HOST_PTR,hostbuf=MyDataX)
-equemene
+    # clDataV = cl.Buffer(ctx, mf.WRITE_ONLY|mf.COPY_HOST_PTR,hostbuf=MyDataV)
-equemene
+    # clPotential = cl.Buffer(ctx, mf.WRITE_ONLY|mf.COPY_HOST_PTR,hostbuf=MyPotential)
-equemene
+    # clKinetic = cl.Buffer(ctx, mf.WRITE_ONLY|mf.COPY_HOST_PTR,hostbuf=MyKinetic)
-equemene
+    # clCoM = cl.Buffer(ctx, mf.WRITE_ONLY|mf.COPY_HOST_PTR,hostbuf=MyCoM)
 equemene
-equemene
+    print('All particles superimposed.')
 equemene
-equemene
+    # Set particles to RNG points
-equemene
+    if InitialRandom:
-equemene
+        seed_w=np.uint32(nprnd(2**32))
-equemene
+        seed_z=np.uint32(nprnd(2**32))
-equemene
+    else:
-equemene
+        seed_w=np.uint32(19710211)
-equemene
+        seed_z=np.uint32(20081010)
 equemene
-equemene
+    if Shape=='Ball':
-equemene
+        MyRoutines.InBallSplutterPoints(queue,(Number,1),None,clDataX,SizeOfShape,seed_w,seed_z)
-equemene
+    else:
-equemene
+        MyRoutines.InBoxSplutterPoints(queue,(Number,1),None,clDataX,SizeOfShape,seed_w,seed_z)
 equemene
-equemene
+    print('All particules distributed')
 equemene
-equemene
+    CLLaunch=MyRoutines.CenterOfMass(queue,(1,1),None,clDataX,clCoM,np.int32(Number))
-equemene
+    CLLaunch.wait()
-equemene
+    cl.enqueue_copy(queue,MyCoM,clCoM)
-equemene
+    print('Center Of Mass estimated: (%s,%s,%s)' % (MyCoM[0],MyCoM[1],MyCoM[2]))
 equemene
-equemene
+    if VirielStress:
-equemene
+        CLLaunch=MyRoutines.SplutterStress(queue,(Number,1),None,clDataX,clDataV,clCoM,MyFloat(0.),np.uint32(110271),np.uint32(250173))
-equemene
+    else:
-equemene
+        CLLaunch=MyRoutines.SplutterStress(queue,(Number,1),None,clDataX,clDataV,clCoM,Velocity,np.uint32(110271),np.uint32(250173))
-equemene
+    CLLaunch.wait()
 equemene
-equemene
+    print('All particules stressed')
 equemene
-equemene
+    CLLaunch=MyRoutines.Potential(queue,(Number,1),None,clDataX,clPotential)
-equemene
+    CLLaunch=MyRoutines.Kinetic(queue,(Number,1),None,clDataV,clKinetic)
-equemene
+    CLLaunch.wait()
-equemene
+    cl.enqueue_copy(queue,MyPotential,clPotential)
-equemene
+    cl.enqueue_copy(queue,MyKinetic,clKinetic)
-equemene
+    print('Energy estimated: Viriel=%s Potential=%s Kinetic=%s\n'% (np.sum(MyPotential)+2*np.sum(MyKinetic),np.sum(MyPotential),np.sum(MyKinetic)))
 equemene
-equemene
+    if SpeedRendering:
-equemene
+        SizeOfBox=max(2*MyKinetic)
-equemene
+    else:
-equemene
+        SizeOfBox=SizeOfShape
 equemene
-equemene
+    if OpenGL:
-equemene
+        print('\tTiny documentation to interact OpenGL rendering:\n')
-equemene
+        print('\t<Left|Right> Rotate around X axis')
-equemene
+        print('\t  <Up|Down>  Rotate around Y axis')
-equemene
+        print('\t   <z|Z>     Rotate around Z axis')
-equemene
+        print('\t   <-|+>     Unzoom/Zoom')
-equemene
+        print('\t    <s>      Toggle to display Positions or Velocities')
-equemene
+        print('\t   <Esc>     Quit\n')
 equemene
-equemene
+    wall_time_start=time.time()
 equemene
-equemene
+    Durations=np.array([],dtype=MyFloat)
-equemene
+    print('Starting!')
-equemene
+    if OpenGL:
-equemene
+        global ViewRX,ViewRY,ViewRZ
-equemene
+        Iterations=0
-equemene
+        ViewRX,ViewRY,ViewRZ = 0.,0.,0.
-equemene
+        # Launch OpenGL Loop
-equemene
+        glutInit(sys.argv)
-equemene
+        glutInitDisplayMode(GLUT_DOUBLE | GLUT_RGB)
-equemene
+        glutSetOption(GLUT_ACTION_ON_WINDOW_CLOSE,GLUT_ACTION_CONTINUE_EXECUTION)
-equemene
+        glutInitWindowSize(512,512)
-equemene
+        glutCreateWindow(b'NBodyGL')
-equemene
+        setup_viewport()
-equemene
+        glutReshapeFunc(reshape)
-equemene
+        glutDisplayFunc(display)
-equemene
+        glutIdleFunc(display)
-equemene
+        #   glutMouseFunc(mouse)
-equemene
+        glutSpecialFunc(special)
-equemene
+        glutKeyboardFunc(keyboard)
-equemene
+        glutMainLoop()
-equemene
+    else:
-equemene
+        for iteration in range(Iterations):
-equemene
+            Elapsed=MainOpenCL(clDataX,clDataV,Step,Method)
-equemene
+            if Verbose:
-equemene
+                # print("Duration of #%s iteration: %s" % (iteration,Elapsed))
-equemene
+                cl.enqueue_copy(queue, MyDataX, clDataX)
-equemene
+                print("Positions for #%s iteration: %s" % (iteration,MyDataX))
-equemene
+            else:
-equemene
+                sys.stdout.write('.')
-equemene
+                sys.stdout.flush()
-equemene
+            Durations=np.append(Durations,Elapsed)
 equemene
-equemene
+    print('\nEnding!')
 equemene
-equemene
+    MyRoutines.CenterOfMass(queue,(1,1),None,clDataX,clCoM,np.int32(Number))
-equemene
+    CLLaunch=MyRoutines.Potential(queue,(Number,1),None,clDataX,clPotential)
-equemene
+    CLLaunch=MyRoutines.Kinetic(queue,(Number,1),None,clDataV,clKinetic)
-equemene
+    CLLaunch.wait()
-equemene
+    cl.enqueue_copy(queue,MyCoM,clCoM)
-equemene
+    cl.enqueue_copy(queue,MyPotential,clPotential)
-equemene
+    cl.enqueue_copy(queue,MyKinetic,clKinetic)
-equemene
+    print('\nCenter Of Mass estimated: (%s,%s,%s)' % (MyCoM[0],MyCoM[1],MyCoM[2]))
-equemene
+    print('Energy estimated: Viriel=%s Potential=%s Kinetic=%s\n'% (np.sum(MyPotential)+2.*np.sum(MyKinetic),np.sum(MyPotential),np.sum(MyKinetic)))
 equemene
-equemene
+    print("Duration stats on device %s with %s iterations :\n\tMean:\t%s\n\tMedian:\t%s\n\tStddev:\t%s\n\tMin:\t%s\n\tMax:\t%s\n\n\tVariability:\t%s\n" % (Device,Iterations,np.mean(Durations),np.median(Durations),np.std(Durations),np.min(Durations),np.max(Durations),np.std(Durations)/np.median(Durations)))
 equemene
-equemene
+    # FPS: 1/Elapsed
-equemene
+    FPS=np.ones(len(Durations))
-equemene
+    FPS/=Durations
 equemene
-equemene
+    print("FPS stats on device %s with %s iterations :\n\tMean:\t%s\n\tMedian:\t%s\n\tStddev:\t%s\n\tMin:\t%s\n\tMax:\t%s\n" % (Device,Iterations,np.mean(FPS),np.median(FPS),np.std(FPS),np.min(FPS),np.max(FPS)))
 equemene
-equemene
+    # Contraction of Square*Size*Hertz: Size*Size/Elapsed
-equemene
+    Squertz=np.ones(len(Durations))
-equemene
+    Squertz*=Number*Number
-equemene
+    Squertz/=Durations
 equemene
-equemene
+    print("Squertz in log10 & complete stats on device %s with %s iterations :\n\tMean:\t%s\t%s\n\tMedian:\t%s\t%s\n\tStddev:\t%s\t%s\n\tMin:\t%s\t%s\n\tMax:\t%s\t%s\n" % (Device,Iterations,np.log10(np.mean(Squertz)),np.mean(Squertz),np.log10(np.median(Squertz)),np.median(Squertz),np.log10(np.std(Squertz)),np.std(Squertz),np.log10(np.min(Squertz)),np.min(Squertz),np.log10(np.max(Squertz)),np.max(Squertz)))
 equemene
-equemene
+    clDataX.release()
-equemene
+    clDataV.release()
-equemene
+    clKinetic.release()
-equemene
+    clPotential.release()

Centre Blaise Pascal » Bench4GPU

root / NBody / NBody.py @ 226