Resultados de la búsqueda a petición "cuda"

1 la respuesta

Encuentra memoria de tarjeta gráfica disponible usando Fortran

Estoy usando GlobalMemoryStatusEX para averiguar la cantidad de memoria en mi sistema. ¿Hay una manera similar de encontrar la cantidad de memoria en mi tarjeta gráfica? Aquí hay un fragmento de mi código: use kernel32 use ifwinty implicit none ...

1 la respuesta

¿Cómo diferenciar entre punteros a memoria compartida y global?

En CUDA, dado el valor de un puntero, o la dirección de una variable, ¿hay una API intrínseca u otra API que inspeccione a qué espacio de direcciones se refi...

3 la respuesta

¿Cómo se lanza un kernel CUDA?

He creado una aplicación CUDA simple para agregar dos matrices. Se está compilando bien. Quiero saber cómo se lanzará el kernel con todos los subprocesos y ¿...

0 la respuesta

Algoritmo de CUDA dijkstra [cerrado]

¿Alguien ha implementado una versión de paralelización CUDA del algoritmo de Dijkstra para un gráfico de matriz dispersa dada (cuSPARSE), y para la fuente y ...

10 la respuesta

Explicación de CUDA C y C ++

¿Alguien puede darme una buena explicación sobre la naturaleza de CUDA C y C ++? Según tengo entendido, se supone que CUDA es C con las bibliotecas de GPU de NVIDIA. A partir de ahora, CUDA C admite algunas características de C ++ pero ...

4 la respuesta

CUDA determinando hilos por bloque, bloques por cuadrícula

Soy nuevo en el paradigma de CUDA. Mi pregunta es determinar el número de subprocesos por bloque y los bloques por cuadrícula. ¿Un poco de arte y prueba juega con esto? Lo que he encontrado es que muchos ejemplos tienen un número aparentemente ...

2 la respuesta

CUDA: llamando a la función de biblioteca en el kernel

Sé que existe la restricción de llamar solo__device__ funciones en el kernel. Esto me impide llamar a funciones estándar comostrcmp() y así sucesivamente en el núcleo. En este momento no puedo entender / encontrar las razones para esto. ...

8 la respuesta

Error de argumento inválido al copiar datos del dispositivo al host

Tengo problemas para copiar los datos de mi dispositivo de nuevo al host. Mis datos están organizados en una estructura: typedef struct Array2D { double* arr; int rows; int cols; } Array2D;arr es una matriz 'plana'. @rows ycols describe las ...

1 la respuesta

CUDA __threadfence ()

Repasé muchas publicaciones en el foro y la documentación de NVIDIA, pero no pude entender qué__threadfence() hace y cómo usarlo. ¿Alguien podría explicar cuál es el propósito de ese intrínseco?

2 la respuesta

CUDA SASS a Cubin

Con CuObjDump, SASS puede generarse desde un archivo Cubin usandocuobjdump -sass <input file>Pero, ¿hay alguna forma de convertir el SASS de nuevo a Cubin?