Resultados de la búsqueda a petición "gpu-programming"
CUDA Thrust: reduce_por_clave solo en algunos valores de una matriz, basados en valores de una matriz "clave"
Digamos que tengo dos arreglos de device_vector <byte>,
Cómo puede usar la función de grupos cooperativos de CUDA en Windows
Mi GPU es GeForce MX150, arquitectura pascal, CC. 6.1, CUDA 9.1, windows 10. Aunque mi GPU es pascal pero los grupos cooperativos no funcionan. Quiero usarlo para la sincronización entre bloques. Encontré que mi modo tcc no está activo. También ...
Cómo determinar el tamaño de lote máximo para un modelo de entrenamiento RNN de tensorflow seq2seq
Actualmente, estoy usando el 64 predeterminado como el tamaño de lote para el modelo seq2seq tensorflow. ¿Cuál es el tamaño máximo de lote, el tamaño de la capa, etc. Puedo usar una sola GPU Titan X con 12 GB de RAM con Haswell-E xeon 128 GB de ...
Implementación de tabla hash para GPU [cerrado]
Estoy buscando una implementación de tabla hash que pueda usar para la codificación CUDA. ¿Hay alguien bueno por ahí? Algo así como el diccionario Python. Usaré cadenas como mis llaves
Diferencias entre VexCL, Thrust y Boost.Compute
Con solo una comprensión superficial de estas bibliotecas, parecen ser muy similares. Sé que VexCL y Boost.Compute usan OpenCl como backend (aunque la versió...
Cómo interrumpir o cancelar un núcleo CUDA del código del host
Estoy trabajando con CUDA y estoy tratando de detener el funcionamiento de mis núcleos (es decir, terminar todos los hilos en ejecución) después de un ciertoif El bloque está siendo golpeado. ¿Cómo puedo hacer eso? Estoy realmente atrapado aquí.
rror @Cuda: la función ya se ha definido en otro archivo .cu.obj
Estoy tratando de compilar un proyecto cuda que alguien me envió. Aunque la etapa de compilación pasa, la etapa de enlace falla. A continuación se muestra un ejemplo del error: Error 298 error LNK2005: "int __cdecl compare_ints(void const ...
Rendimiento de cudaMemcpyToSymbol
Tengo algunas funciones que cargan una variable en la memoria constante del dispositivo y lanzan una función del núcleo. Noté que la primera vez que una función carga una variable en memoria constante toma 0.6 segundos, pero las siguientes cargas ...
La vinculación con bibliotecas CUDA de terceros ralentiza cudaMalloc
No es un secreto que en CUDA 4.x la primera llamada a
Puedo ejecutar CUDA en el procesador de gráficos integrado de Intel?
Tengo un portátil Toshiba muy simple con procesador i3. Además, no tengo ninguna tarjeta gráfica costosa. En la configuración de pantalla, veo Gráficos Intel (HD) como adaptador de pantalla. Estoy planeando aprender algo de programación cuda. ...
Página 1 de 2