¿por qué no puedo obtener la suma correcta de matriz 1D con numba (cuda python)?

Question

Mar 29, 2017, 09:58 AM

¿por qué no puedo obtener la suma correcta de matriz 1D con numba (cuda python)?

Intento usar cuda python con numba. El código es calcular la suma de una matriz 1D de la siguiente manera, pero no sé cómo obtener un resultado de valor en lugar de tres valores.

python3.5 con numba + CUDA8.0

import os,sys,time
import pandas as pd
import numpy as np
from numba import cuda, float32

os.environ['NUMBAPRO_NVVM']=r'D:\NVIDIA GPU Computing Toolkit\CUDA\v8.0\nvvm\bin\nvvm64_31_0.dll'
os.environ['NUMBAPRO_LIBDEVICE']=r'D:\NVIDIA GPU Computing Toolkit\CUDA\v8.0\nvvm\libdevice'

bpg = (1,1) 
tpb = (1,3) 

@cuda.jit
def calcu_sum(D,T):
    ty = cuda.threadIdx.y
    bh = cuda.blockDim.y
    index_i = ty
    L = len(D)
    su = 0
    while index_i<L:
        su +=D[index_i]
        index_i +=bh
    print('su:',su)
    T[0,0]=su
    print('T:',T[0,0])


D = np.array([ 0.42487645,0.41607881,0.42027071,0.43751907,0.43512794,0.43656972,
               0.43940639,0.43864551,0.43447691,0.43120232], dtype=np.float32)
T = np.empty([1,1])
print('D: ',D)

stream = cuda.stream()
with stream.auto_synchronize():
    dD = cuda.to_device(D, stream)
    dT= cuda.to_device(TE, stream)
    calcu_sum[bpg, tpb, stream](dD,dT)

El resultado es:

D:  [ 0.42487645  0.41607881  0.42027071  0.43751907  0.43512794  0.43656972
  0.43940639  0.43864551  0.43447691  0.43120232]
su:  1.733004
su:  1.289852
su:  1.291317
T: 1.733004
T: 1.289852
T: 1.291317

¿Por qué no puedo obtener la salida "4.31417383" en lugar de "1.733004 1.289852 1.291317"? 1.733004 + 1.289852 + 1.291317 = 4.314173.

Soy nuevo en numba, leo la documentación de numba, pero no sé cómo hacerlo. ¿Alguien puede dar consejos?

Respuestas a la pregunta(1)

Preguntas populares

0 la respuesta

C ++: Impacto en el rendimiento de las clases BIG (con mucho código)

0 la respuesta

Recorrido del gráfico con Networkx (Python)

0 la respuesta

Usando iText, ¿cómo puedo aplicar css a mi documento PDF usando CssResolver y CssFile?

0 la respuesta

Visualice el enlace al formulario de cambio completo para el objeto en django admin

0 la respuesta

Angular 6 router.events.filter 'filter' no existe en el tipo 'Observable <Event>'

¡Eres muy activo! ¡Es genial!

¿por qué no puedo obtener la suma correcta de matriz 1D con numba (cuda python)?

Respuestas a la pregunta(1)

Su respuesta a la pregunta

Preguntas populares