Resultados de la búsqueda a petición "cuda"

2 la respuesta

l programa @CUDA hace que el controlador nvidia se bloquee

Mi programa de cálculo CUDA monte carlo pi está causando que mi controlador nvidia se bloquee cuando supero alrededor de 500 pruebas y 256 bloques completos. Parece estar sucediendo en la función del núcleo monteCarlo. Se agradece cualquier ...

2 la respuesta

¿Cómo se dividen los bloques CUDA en urdimbres?

Si comienzo mi kernel con una cuadrícula cuyos bloques tienen dimensiones: dim3 block_dims(16,16); ¿Cómo se dividen los bloques de cuadrícula en urdimbres? ¿Las primeras dos filas de dicho bloque forman una deformación, o las dos primeras ...

2 la respuesta

cudamemcpy error: "se agotó el tiempo de espera del lanzamiento y finalizó"

Mi código es una implicación paralela que calcula el enésimo dígito de pi. Cuando termino el kernel e intento copiar la memoria de nuevo al host, aparece el error "el tiempo de ejecución se agotó y finalizó". Utilicé este código para la ...

2 la respuesta

Debo unificar dos núcleos similares con una declaración 'si', arriesgando pérdida de rendimiento?

Tengo 2 funciones de kernel muy similares, en el sentido de que el código es casi el mismo, pero con una ligera diferencia. Actualmente tengo 2 opciones: Escriba 2 métodos diferentes (pero muy similares)Escriba un solo núcleo y coloque los ...

2 la respuesta

Cómo lograr que VS 2010 reconozca ciertas funciones de CUDA

En este momento, CUDA ya reconoce una función clave de CUDA C / C ++ comocudaMalloc, cudaFree, cudaEventCreate, etc. También reconoce ciertos tipos comodim3 ycudaEvent_t. in embargo, no reconoce otras funciones y tipos, como la plantilla de ...

1 la respuesta

Variable global en CUDA

¿Cómo puedo crear variables globales en CUDA? ¿Me podría dar un ejemplo? Cómo puede crear matrices dentro de una función CUDA, por ejemplo __global__ void test() { int *a = new int[10]; } o ¿Cómo puedo crear una matriz global y acceder a ella ...

1 la respuesta

Diferencia entre cuda.h, cuda_runtime.h, cuda_runtime_api.h

Estoy empezando a programar con CUDA, y en algunos ejemplos encuentro los archivos de inclusióncuda.h, cuda_runtime.h ycuda_runtime_api.h incluido en el código. ¿Alguien puede explicarme la diferencia entre estos archivos?

1 la respuesta

Ejemplo de punto muerto realista en CUDA / OpenCL

Para un tutorial que estoy escribiendo, estoy buscando un ejemplo "realista" y simple de un punto muerto causado por la ignorancia de SIMT / SIMD. e me ocurrió este fragmento, que parece ser un buen ejempl Cualquier comentario sería ...

2 la respuesta

¿por qué mi programa c usa de repente 30 g de memoria virtual?

En la parte superior, noté que mi programa c (usando CUDA 3.2) tiene un tamaño virtual de 28g o más (mirando VIRT), en cada ejecución desde el principio. Esto no tiene NINGÚN sentido para mí. La memoria residente tiene sentido y solo ...

3 la respuesta

¿Hay alguna forma de establecer el valor predeterminado para la matriz de memoria compartida?

Considere el siguiente código: __global__ void kernel(int *something) { extern __shared__ int shared_array[]; // Some operations on shared_array here. } ¿Es posible establecer todo shared_array en algún valor? 0: ¿sin abordar explícitamente ...