¿Cómo perfilar el código PyCuda con el Visual Profiler?

Cuando creo una nueva sesión y le digo al Visual Profiler que inicie mis scripts python / pycuda, aparece el siguiente mensaje de error:Execution run #1 of program '' failed, exit code: 255

Estas son mis preferencias:

Lanzamiento:python "/pathtopycudafile/mysuperkernel.py"Directorio de trabajo:"/pathtopycudafile/mysuperkernel.py" Argumentos:[empty]

Uso CUDA 4.0 en Ubuntu 10.10. 64Bit. Perfiles de ejemplos compilados funciona.

PD. Soy consciente de SO pregunta ¿Cómo perfilar el código PyCuda en Linux?, pero parece ser un problema no relacionado.

Ejemplo mínimo

pycudaexample.py:

import pycuda.autoinit
import pycuda.driver as drv
import numpy

from pycuda.compiler import SourceModule

mod = SourceModule("""
__global__ void multiply_them(float *dest, float *a, float *b)
{
  const int i = threadIdx.x;
  dest[i] = a[i] * b[i];
}
""")

multiply_them = mod.get_function("multiply_them")

a = numpy.random.randn(400).astype(numpy.float32)
b = numpy.random.randn(400).astype(numpy.float32)

dest = numpy.zeros_like(a)
multiply_them(
        drv.Out(dest), drv.In(a), drv.In(b),
        block=(400,1,1), grid=(1,1))

pycuda.autoinit.context.detach()

Configuración de ejemplo

Mensaje de erro

Respuestas a la pregunta(2)

Su respuesta a la pregunta