Resultados de la búsqueda a petición "cuda"

1 la respuesta

Error de lanzamiento de transformación de empuje: "bulk_kernel_by_value: se encontró un acceso ilegal a la memoria"

Soy bastante nuevo en CUDA / Thrust y tengo un problema con un fragmento de código. Para hacerlo más fácil, lo he reducido al mínimo. El código es el siguiente: struct functor{ functor(float (*g)(const float&)) : _g{g} {} __host__ ...

2 la respuesta

Cómo interrumpir o cancelar un núcleo CUDA del código del host

Estoy trabajando con CUDA y estoy tratando de detener el funcionamiento de mis núcleos (es decir, terminar todos los hilos en ejecución) después de un ciertoif El bloque está siendo golpeado. ¿Cómo puedo hacer eso? Estoy realmente atrapado aquí.

3 la respuesta

Intentando que CUDA 7.5 funcione con GCC 5.x

Por lo tanto, si intenta usar nvcc cuando el sistema GCC es la versión 5 en adelante, obtiene un error de "versión no compatible". Pero, he escuchado a personas informar que acaban de comentar esto y que CUDA 7.5 "funciona para ellos" con GCC ...

1 la respuesta

CUDA - Creando objetos en el kernel y usándolos en el host [duplicado]

Esta pregunta ya tiene una respuesta aquí: Cómo copiar la memoria asignada en la función del dispositivo a la memoria principal [/questions/13043164/how-to-copy-the-memory-allocated-in-device-function-back-to-main-memory] 1 respuestaNecesito ...

1 la respuesta

Cómo explicar la repetición de instrucciones en CUDA

¿Podría alguien resumir la definición y las razones de los diferentes tipos de repeticiones de instrucciones en ...

1 la respuesta

CUDA: Cómo usar -arch y -code y SM vs COMPUTE

Todavía no estoy seguro de cómo especificar correctamente las arquitecturas para la generación de código al compilar con nvcc. Soy consciente de que hay un código de máquina y un código PTX incrustado en mi binario y que esto se puede controlar a ...

1 la respuesta

Transmitir char * a unsigned int * en CUDA

Tengo un tipo definido comotypedef unsigned char uint40[5] y luego tengo una serie de uint40, digamosuint40* payloads Estaba intentando portar la siguiente función en un núcleo CUDA void aSimpleFunction(int M, uint40* data) { for (auto i = 0; i ...

1 la respuesta

CUDA: Copie la matriz 1D de la GPU a la matriz 2D en el host

int main() { char** hMat,* dArr; hMat = new char*[10]; for (int i=0;i<10;i++) { hMat[i] = new char[10]; } cudaMalloc((void**)&dArr,100); // Copy from dArr to hMat here: }Tengo una matrizdArr en la GPU, y quiero copiarlo en una matriz 2DhMat en el ...

1 la respuesta

Hacer que el número de ocurrencias clave sea igual usando CUDA / Thrust

¿Hay una manera eficiente de tomar un par ordenado de matriz de clave / valor y garantizar que cada clave tenga el mismo número de elementos utilizando la biblioteca CUDA Thrust? Por ejemplo, supongamos que tenemos el siguiente par de ...

1 la respuesta

Operación simple en Estructura en CUDA: Error de segmentación [duplicado]

Esta pregunta ya tiene una respuesta aquí: Copiando una estructura que contiene punteros al dispositivo CUDA [/questions/9309195/copying-a-struct-containing-pointers-to-cuda-device] 3 respuestas Esta es la primera vez que estoy implementando ...