Resultados de la búsqueda a petición "cuda"

2 la respuesta

cudamemcpy error: "se agotó el tiempo de espera del lanzamiento y finalizó"

Mi código es una implicación paralela que calcula el enésimo dígito de pi. Cuando termino el kernel e intento copiar la memoria de nuevo al host, aparece el error "el tiempo de ejecución se agotó y finalizó". Utilicé este código para la ...

4 la respuesta

Cómo separar el código CUDA en múltiples archivos

1 la respuesta

¿Cuánta memoria puedo asignar realmente en una tarjeta Cuda?

Estoy escribiendo un proceso de servidor que realiza cálculos en una GPU usando cuda. Quiero poner en cola las solicitudes entrantes hasta que haya suficiente memoria disponible en el dispositivo para ejecutar el trabajo, pero me resulta difícil ...

1 la respuesta

Ejemplo de punto muerto realista en CUDA / OpenCL

Para un tutorial que estoy escribiendo, estoy buscando un ejemplo "realista" y simple de un punto muerto causado por la ignorancia de SIMT / SIMD. e me ocurrió este fragmento, que parece ser un buen ejempl Cualquier comentario sería ...

3 la respuesta

Técnicas para reducir la latencia de transferencia de datos de CPU a GPU

He estado buscando formas de reducir la latencia causada por la transferencia de datos desde la CPU y la GPU. Cuando comencé a usar CUDA, noté que la transferencia de datos entre la CPU y la GPU tomó unos segundos, pero realmente no me importó ...

2 la respuesta

cuda: sin memoria (problemas con hilos y bloques): la dirección está fuera de los límites

2 la respuesta

Para bucles anidados con CUDA

Tengo un problema con algunos bucles anidados que tengo que convertir de C / C ++ a CUDA. Básicamente tengo 4 para bucles anidados que comparten la misma matriz y realizan operaciones de desplazamiento de bits. #define N 65536 ...

2 la respuesta

¿Cómo medir el tiempo interno del kernel en NVIDIA CUDA?

Quiero medir el tiempo en el kernel interno de la GPU, ¿cómo medirlo en NVIDIA CUDA? p.ej.

2 la respuesta

¿Dónde asigna CUDA el marco de pila para los núcleos?

Mi llamada al kernel falla con "memoria insuficiente". Hace un uso significativo del marco de la pila y me preguntaba si esta es la razón de su falla. Al invocar nvcc con --ptxas-options = -v, imprime la siguiente información ...

2 la respuesta

Reducir columnas matriciales con CUDA.

Tengo una matriz y me gustaría usar CUDA y, de la manera más rápida posible, calcular la media por columnas (se reduce a ser simplemente la suma), es decir, ...