¿Cómo puedo alimentar una matriz bidimensional en un kernel con pycuda?

He creado una matriz numpy de float32s con forma(64, 128), y quiero enviarlo a la GPU. ¿Cómo puedo hacer eso? ¿Qué argumentos debería aceptar la función de mi kernel?float** myArray?

He intentado enviar directamente la matriz como está a la GPU, pero Pycuda se queja de que se está accediendo a los objetos ...

Respuestas a la pregunta(1)

Su respuesta a la pregunta