¿Cómo perfilar el código PyCuda con el Visual Profiler?
Cuando creo una nueva sesión y le digo al Visual Profiler que inicie mis scripts python / pycuda, aparece el siguiente mensaje de error:Execution run #1 of program '' failed, exit code: 255
Estas son mis preferencias:
Lanzamiento:python "/pathtopycudafile/mysuperkernel.py"
Directorio de trabajo:"/pathtopycudafile/mysuperkernel.py"
Argumentos:[empty]
Uso CUDA 4.0 en Ubuntu 10.10. 64Bit. Perfiles de ejemplos compilados funciona.
PD. Soy consciente de SO pregunta ¿Cómo perfilar el código PyCuda en Linux?, pero parece ser un problema no relacionado.
Ejemplo mínimo
pycudaexample.py:
import pycuda.autoinit
import pycuda.driver as drv
import numpy
from pycuda.compiler import SourceModule
mod = SourceModule("""
__global__ void multiply_them(float *dest, float *a, float *b)
{
const int i = threadIdx.x;
dest[i] = a[i] * b[i];
}
""")
multiply_them = mod.get_function("multiply_them")
a = numpy.random.randn(400).astype(numpy.float32)
b = numpy.random.randn(400).astype(numpy.float32)
dest = numpy.zeros_like(a)
multiply_them(
drv.Out(dest), drv.In(a), drv.In(b),
block=(400,1,1), grid=(1,1))
pycuda.autoinit.context.detach()
Configuración de ejemplo
Mensaje de erro