Resultados de la búsqueda a petición "gpu-programming"

2 la respuesta

CUDA Thrust: reduce_por_clave solo en algunos valores de una matriz, basados ​​en valores de una matriz "clave"

Digamos que tengo dos arreglos de device_vector <byte>,

1 la respuesta

Cómo puede usar la función de grupos cooperativos de CUDA en Windows

Mi GPU es GeForce MX150, arquitectura pascal, CC. 6.1, CUDA 9.1, windows 10. Aunque mi GPU es pascal pero los grupos cooperativos no funcionan. Quiero usarlo para la sincronización entre bloques. Encontré que mi modo tcc no está activo. También ...

3 la respuesta

Cómo determinar el tamaño de lote máximo para un modelo de entrenamiento RNN de tensorflow seq2seq

Actualmente, estoy usando el 64 predeterminado como el tamaño de lote para el modelo seq2seq tensorflow. ¿Cuál es el tamaño máximo de lote, el tamaño de la capa, etc. Puedo usar una sola GPU Titan X con 12 GB de RAM con Haswell-E xeon 128 GB de ...

2 la respuesta

Implementación de tabla hash para GPU [cerrado]

Estoy buscando una implementación de tabla hash que pueda usar para la codificación CUDA. ¿Hay alguien bueno por ahí? Algo así como el diccionario Python. Usaré cadenas como mis llaves

1 la respuesta

Diferencias entre VexCL, Thrust y Boost.Compute

Con solo una comprensión superficial de estas bibliotecas, parecen ser muy similares. Sé que VexCL y Boost.Compute usan OpenCl como backend (aunque la versió...

2 la respuesta

Cómo interrumpir o cancelar un núcleo CUDA del código del host

Estoy trabajando con CUDA y estoy tratando de detener el funcionamiento de mis núcleos (es decir, terminar todos los hilos en ejecución) después de un ciertoif El bloque está siendo golpeado. ¿Cómo puedo hacer eso? Estoy realmente atrapado aquí.

3 la respuesta

rror @Cuda: la función ya se ha definido en otro archivo .cu.obj

Estoy tratando de compilar un proyecto cuda que alguien me envió. Aunque la etapa de compilación pasa, la etapa de enlace falla. A continuación se muestra un ejemplo del error: Error 298 error LNK2005: "int __cdecl compare_ints(void const ...

1 la respuesta

Rendimiento de cudaMemcpyToSymbol

Tengo algunas funciones que cargan una variable en la memoria constante del dispositivo y lanzan una función del núcleo. Noté que la primera vez que una función carga una variable en memoria constante toma 0.6 segundos, pero las siguientes cargas ...

1 la respuesta

La vinculación con bibliotecas CUDA de terceros ralentiza cudaMalloc

No es un secreto que en CUDA 4.x la primera llamada a

4 la respuesta

Puedo ejecutar CUDA en el procesador de gráficos integrado de Intel?

Tengo un portátil Toshiba muy simple con procesador i3. Además, no tengo ninguna tarjeta gráfica costosa. En la configuración de pantalla, veo Gráficos Intel (HD) como adaptador de pantalla. Estoy planeando aprender algo de programación cuda. ...