/ETSN/MySteps_0.py - Annoter - Bench4GPU - Forge du Centre Blaise Pascal

root / ETSN / MySteps_0.py @ 285

Historique | Voir | Annoter | Télécharger (1,7 ko)

-equemene
+#!/usr/bin/env python3
 equemene
-equemene
+import numpy as np
-equemene
+import pyopencl as cl
 equemene
-equemene
+# Native Operation under Numpy (for prototyping & tests
-equemene
+def NativeAddition(a_np,b_np):
-equemene
+    return(a_np+b_np)
 equemene
-equemene
+# OpenCL complete operation
-equemene
+def OpenCLAddition(a_np,b_np):
 equemene
-equemene
+    # Context creation
-equemene
+    ctx = cl.create_some_context()
-equemene
+    # Every process is stored in a queue
-equemene
+    queue = cl.CommandQueue(ctx)
 equemene
-equemene
+    # Copy from Host to Device using pointers
-equemene
+    mf = cl.mem_flags
-equemene
+    a_g = cl.Buffer(ctx, mf.READ_ONLY | mf.COPY_HOST_PTR, hostbuf=a_np)
-equemene
+    b_g = cl.Buffer(ctx, mf.READ_ONLY | mf.COPY_HOST_PTR, hostbuf=b_np)
 equemene
-equemene
+    # Definition of kernel under OpenCL
-equemene
+    prg = cl.Program(ctx, """
-equemene
+__kernel void sum(
-equemene
+    __global const float *a_g, __global const float *b_g, __global float *res_g)
 equemene
-equemene
+  int gid = get_global_id(0);
-equemene
+  res_g[gid] = a_g[gid] + b_g[gid];
 equemene
-equemene
+""").build()
 equemene
-equemene
+    # Memory allocation on Device for result
-equemene
+    res_g = cl.Buffer(ctx, mf.WRITE_ONLY, a_np.nbytes)
-equemene
+    # Synthesis of function "sum" inside Kernel Sources
-equemene
+    knl = prg.sum  # Use this Kernel object for repeated calls
-equemene
+    # Call of kernel previously defined
-equemene
+    knl(queue, a_np.shape, None, a_g, b_g, res_g)
 equemene
-equemene
+    # Creation of vector for result with same size as input vectors
-equemene
+    res_np = np.empty_like(a_np)
-equemene
+    # Copy from Device to Host
-equemene
+    cl.enqueue_copy(queue, res_np, res_g)
 equemene
-equemene
+    # Liberation of memory
-equemene
+    a_g.release()
-equemene
+    b_g.release()
-equemene
+    res_g.release()
 equemene
-equemene
+    return(res_np)
 equemene
-equemene
+#if __name__=='__main__':
 equemene
-equemene
+a_np = np.random.rand(50000).astype(np.float32)
-equemene
+b_np = np.random.rand(50000).astype(np.float32)
 equemene
-equemene
+res_np=NativeAddition(a_np,b_np)
-equemene
+res_cl=OpenCLAddition(a_np,b_np)
 equemene
-equemene
+# Check on CPU with Numpy:
-equemene
+print(res_cl - res_np)
-equemene
+print(np.linalg.norm(res_cl - res_np))
-equemene
+assert np.allclose(res_np, res_cl)

Centre Blaise Pascal » Bench4GPU

root / ETSN / MySteps_0.py @ 285