Resultados de la búsqueda a petición "cuda"
l programa @CUDA hace que el controlador nvidia se bloquee
Mi programa de cálculo CUDA monte carlo pi está causando que mi controlador nvidia se bloquee cuando supero alrededor de 500 pruebas y 256 bloques completos. Parece estar sucediendo en la función del núcleo monteCarlo. Se agradece cualquier ...
¿Cómo se dividen los bloques CUDA en urdimbres?
Si comienzo mi kernel con una cuadrícula cuyos bloques tienen dimensiones: dim3 block_dims(16,16); ¿Cómo se dividen los bloques de cuadrícula en urdimbres? ¿Las primeras dos filas de dicho bloque forman una deformación, o las dos primeras ...
cudamemcpy error: "se agotó el tiempo de espera del lanzamiento y finalizó"
Mi código es una implicación paralela que calcula el enésimo dígito de pi. Cuando termino el kernel e intento copiar la memoria de nuevo al host, aparece el error "el tiempo de ejecución se agotó y finalizó". Utilicé este código para la ...
Debo unificar dos núcleos similares con una declaración 'si', arriesgando pérdida de rendimiento?
Tengo 2 funciones de kernel muy similares, en el sentido de que el código es casi el mismo, pero con una ligera diferencia. Actualmente tengo 2 opciones: Escriba 2 métodos diferentes (pero muy similares)Escriba un solo núcleo y coloque los ...
Cómo lograr que VS 2010 reconozca ciertas funciones de CUDA
En este momento, CUDA ya reconoce una función clave de CUDA C / C ++ comocudaMalloc, cudaFree, cudaEventCreate, etc. También reconoce ciertos tipos comodim3 ycudaEvent_t. in embargo, no reconoce otras funciones y tipos, como la plantilla de ...
Variable global en CUDA
¿Cómo puedo crear variables globales en CUDA? ¿Me podría dar un ejemplo? Cómo puede crear matrices dentro de una función CUDA, por ejemplo __global__ void test() { int *a = new int[10]; } o ¿Cómo puedo crear una matriz global y acceder a ella ...
Diferencia entre cuda.h, cuda_runtime.h, cuda_runtime_api.h
Estoy empezando a programar con CUDA, y en algunos ejemplos encuentro los archivos de inclusióncuda.h, cuda_runtime.h ycuda_runtime_api.h incluido en el código. ¿Alguien puede explicarme la diferencia entre estos archivos?
Ejemplo de punto muerto realista en CUDA / OpenCL
Para un tutorial que estoy escribiendo, estoy buscando un ejemplo "realista" y simple de un punto muerto causado por la ignorancia de SIMT / SIMD. e me ocurrió este fragmento, que parece ser un buen ejempl Cualquier comentario sería ...
¿por qué mi programa c usa de repente 30 g de memoria virtual?
En la parte superior, noté que mi programa c (usando CUDA 3.2) tiene un tamaño virtual de 28g o más (mirando VIRT), en cada ejecución desde el principio. Esto no tiene NINGÚN sentido para mí. La memoria residente tiene sentido y solo ...
¿Hay alguna forma de establecer el valor predeterminado para la matriz de memoria compartida?
Considere el siguiente código: __global__ void kernel(int *something) { extern __shared__ int shared_array[]; // Some operations on shared_array here. } ¿Es posible establecer todo shared_array en algún valor? 0: ¿sin abordar explícitamente ...