/ETSN/MySteps_1.py - Annoter - Bench4GPU - Forge du Centre Blaise Pascal

268

equemene

#!/usr/bin/env python3

2

268

equemene

3

268

equemene

import numpy as np

4

268

equemene

import pyopencl as cl

5

268

equemene

6

268

equemene

# Native Operation under Numpy (for prototyping & tests

7

268

equemene

def NativeAddition(a_np,b_np):

8

268

equemene

    return(a_np+b_np)

9

268

equemene

10

268

equemene

# OpenCL complete operation

11

268

equemene

def OpenCLAddition(a_np,b_np):

12

268

equemene

13

268

equemene

    # Context creation

14

268

equemene

    ctx = cl.create_some_context()

15

268

equemene

    # Every process is stored in a queue

16

268

equemene

    queue = cl.CommandQueue(ctx)

17

268

equemene

18

268

equemene

    # Copy from Host to Device using pointers

19

268

equemene

    mf = cl.mem_flags

20

268

equemene

    a_g = cl.Buffer(ctx, mf.READ_ONLY | mf.COPY_HOST_PTR, hostbuf=a_np)

21

268

equemene

    b_g = cl.Buffer(ctx, mf.READ_ONLY | mf.COPY_HOST_PTR, hostbuf=b_np)

22

268

equemene

23

268

equemene

    # Definition of kernel under OpenCL

24

268

equemene

    prg = cl.Program(ctx, """

25

268

equemene

__kernel void sum(

26

268

equemene

    __global const float *a_g, __global const float *b_g, __global float *res_g)

27

268

equemene

28

268

equemene

  int gid = get_global_id(0);

29

268

equemene

  res_g[gid] = a_g[gid] + b_g[gid];

30

268

equemene

31

268

equemene

""").build()

32

268

equemene

33

268

equemene

    # Memory allocation on Device for result

34

268

equemene

    res_g = cl.Buffer(ctx, mf.WRITE_ONLY, a_np.nbytes)

35

268

equemene

    # Synthesis of function "sum" inside Kernel Sources

36

268

equemene

    knl = prg.sum  # Use this Kernel object for repeated calls

37

268

equemene

    # Call of kernel previously defined

38

268

equemene

    knl(queue, a_np.shape, None, a_g, b_g, res_g)

39

268

equemene

40

268

equemene

    # Creation of vector for result with same size as input vectors

41

268

equemene

    res_np = np.empty_like(a_np)

42

268

equemene

    # Copy from Device to Host

43

268

equemene

    cl.enqueue_copy(queue, res_np, res_g)

44

268

equemene

45

268

equemene

    return(res_np)

46

268

equemene

47

268

equemene

import sys

48

268

equemene

import time

49

268

equemene

50

268

equemene

if __name__=='__main__':

51

268

equemene

52

268

equemene

    # Size of input vectors definition based on stdin

53

268

equemene

    import sys

54

268

equemene

    try:

55

268

equemene

        SIZE=int(sys.argv[1])

56

268

equemene

        print("Size of vectors set to %i" % SIZE)

57

268

equemene

    except:

58

268

equemene

        SIZE=50000

59

268

equemene

        print("Size of vectors set to default size %i" % SIZE)

60

268

equemene

61

268

equemene

    a_np = np.random.rand(SIZE).astype(np.float32)

62

268

equemene

    b_np = np.random.rand(SIZE).astype(np.float32)

63

268

equemene

64

268

equemene

    TimeIn=time.time()

65

268

equemene

    res_np=NativeAddition(a_np,b_np)

66

268

equemene

    NativeElapsed=time.time()-TimeIn

67

268

equemene

    NativeRate=int(SIZE/NativeElapsed)

68

268

equemene

    print("NativeRate: %i" % NativeRate)

69

268

equemene

70

268

equemene

    TimeIn=time.time()

71

268

equemene

    res_cl=OpenCLAddition(a_np,b_np)

72

268

equemene

    OpenCLElapsed=time.time()-TimeIn

73

268

equemene

    OpenCLRate=int(SIZE/OpenCLElapsed)

74

268

equemene

    print("OpenCLRate: %i" % OpenCLRate)

75

268

equemene

76

268

equemene

    print("OpenCLvsNative ratio: %f" % (OpenCLRate/NativeRate))

77

268

equemene

78

268

equemene

    # Check on CPU with Numpy:

79

268

equemene

    print(res_cl - res_np)

80

268

equemene

    print(np.linalg.norm(res_cl - res_np))

81

268

equemene

    assert np.allclose(res_np, res_cl)

Centre Blaise Pascal » Bench4GPU

root / ETSN / MySteps_1.py @ 274

-equemene
+#!/usr/bin/env python3
 equemene
-equemene
+import numpy as np
-equemene
+import pyopencl as cl
 equemene
-equemene
+# Native Operation under Numpy (for prototyping & tests
-equemene
+def NativeAddition(a_np,b_np):
-equemene
+    return(a_np+b_np)
 equemene
-equemene
+# OpenCL complete operation
-equemene
+def OpenCLAddition(a_np,b_np):
 equemene
-equemene
+    # Context creation
-equemene
+    ctx = cl.create_some_context()
-equemene
+    # Every process is stored in a queue
-equemene
+    queue = cl.CommandQueue(ctx)
 equemene
-equemene
+    # Copy from Host to Device using pointers
-equemene
+    mf = cl.mem_flags
-equemene
+    a_g = cl.Buffer(ctx, mf.READ_ONLY | mf.COPY_HOST_PTR, hostbuf=a_np)
-equemene
+    b_g = cl.Buffer(ctx, mf.READ_ONLY | mf.COPY_HOST_PTR, hostbuf=b_np)
 equemene
-equemene
+    # Definition of kernel under OpenCL
-equemene
+    prg = cl.Program(ctx, """
-equemene
+__kernel void sum(
-equemene
+    __global const float *a_g, __global const float *b_g, __global float *res_g)
 equemene
-equemene
+  int gid = get_global_id(0);
-equemene
+  res_g[gid] = a_g[gid] + b_g[gid];
 equemene
-equemene
+""").build()
 equemene
-equemene
+    # Memory allocation on Device for result
-equemene
+    res_g = cl.Buffer(ctx, mf.WRITE_ONLY, a_np.nbytes)
-equemene
+    # Synthesis of function "sum" inside Kernel Sources
-equemene
+    knl = prg.sum  # Use this Kernel object for repeated calls
-equemene
+    # Call of kernel previously defined
-equemene
+    knl(queue, a_np.shape, None, a_g, b_g, res_g)
 equemene
-equemene
+    # Creation of vector for result with same size as input vectors
-equemene
+    res_np = np.empty_like(a_np)
-equemene
+    # Copy from Device to Host
-equemene
+    cl.enqueue_copy(queue, res_np, res_g)
 equemene
-equemene
+    return(res_np)
 equemene
-equemene
+import sys
-equemene
+import time
 equemene
-equemene
+if __name__=='__main__':
 equemene
-equemene
+    # Size of input vectors definition based on stdin
-equemene
+    import sys
-equemene
+    try:
-equemene
+        SIZE=int(sys.argv[1])
-equemene
+        print("Size of vectors set to %i" % SIZE)
-equemene
+    except:
-equemene
+        SIZE=50000
-equemene
+        print("Size of vectors set to default size %i" % SIZE)
 equemene
-equemene
+    a_np = np.random.rand(SIZE).astype(np.float32)
-equemene
+    b_np = np.random.rand(SIZE).astype(np.float32)
 equemene
-equemene
+    TimeIn=time.time()
-equemene
+    res_np=NativeAddition(a_np,b_np)
-equemene
+    NativeElapsed=time.time()-TimeIn
-equemene
+    NativeRate=int(SIZE/NativeElapsed)
-equemene
+    print("NativeRate: %i" % NativeRate)
 equemene
-equemene
+    TimeIn=time.time()
-equemene
+    res_cl=OpenCLAddition(a_np,b_np)
-equemene
+    OpenCLElapsed=time.time()-TimeIn
-equemene
+    OpenCLRate=int(SIZE/OpenCLElapsed)
-equemene
+    print("OpenCLRate: %i" % OpenCLRate)
 equemene
-equemene
+    print("OpenCLvsNative ratio: %f" % (OpenCLRate/NativeRate))
 equemene
-equemene
+    # Check on CPU with Numpy:
-equemene
+    print(res_cl - res_np)
-equemene
+    print(np.linalg.norm(res_cl - res_np))
-equemene
+    assert np.allclose(res_np, res_cl)