Resultados de la búsqueda a petición "cuda"

Me gustaría medir el tiempo un poco de códigodentromi kernel toma He seguidoesta pregunta [https://stackoverflow.com/questions/11209228/timing-different-sections-in-cuda-kernel] junto con sus comentarios para que mi núcleo se vea más o menos ...

1 la respuesta

CUDA asigna memoria en la función dispositivo

¿Hay alguna manera en CUDA de asignar memoria en la función __device__? No pude encontrar ningún ejemplo de hacer esto. Del manual: B.15 Asignación dinámica de memoria global void * malloc (size_t size); vacío libre (vacío * ptr); asignar y ...

arrays

3 la respuesta

Buscar una matriz ordenada en un núcleo CUDA

Estoy escribiendo un kernel CUDA y cada hilo tiene que completar la siguiente tarea: supongamos que tengo una matriz ordenadaa den enteros sin signo (el primero siempre es 0) almacenados en la memoria compartida, cada subproceso debe encontrar el ...

c gpu-programming c++

4 la respuesta

printf dentro de la función global de CUDA

Actualmente estoy escribiendo una multiplicación matricial en una GPU y me gustaría depurar mi código, pero como no puedo usar printf dentro de una función del dispositivo, ¿hay algo más que pueda hacer para ver qué sucede dentro de esa función? ...

1 la respuesta

Se creó un contexto CUDA en una GPU que actualmente no se puede depurar

Cuando comienzo la depuración de cuda, Nsight devuelve este error: Se creó un contexto CUDA en una GPU que actualmente no se puede depurar. Los puntos de interrupción serán deshabilitados. Adaptador: GeForce GT 720M Este es mi sistema y la ...

c++

1 la respuesta

Cómo estructurar datos para una velocidad óptima en una aplicación CUDA

Estoy intentando escribir un sistema de partículas simple que aproveche CUDA para actualizar las posiciones de las partículas. En este momento estoy definiendo que una partícula tiene un objeto con una posición definida con tres valores de ...

gpu radix-sort cub

1 la respuesta

¿Hacer CUB blockradixsort en chip por completo?

Estoy leyendo las documentaciones y ejemplos de CUB: #include <cub/cub.cuh> // or equivalently <cub/block/block_radix_sort.cuh> __global__ void ExampleKernel(...) { // Specialize BlockRadixSort for 128 threads owning 4 integer items each typedef ...

math algorithm matrix

7 la respuesta

Calcular el espacio nulo de una matriz lo más rápido posible

Necesito calcular el espacio nulo de varios miles de matrices pequeñas (8x9, no 4x3 como escribí anteriormente) en paralelo (CUDA). Todas las referencias apuntan a SVD, pero el algoritmo en recetas numéricas parece muy costoso y me da muchas ...

nvidia nvcc

3 la respuesta

Compilar código cuda para CPU

Estoy estudiando cuda 5.5 pero no tengo ninguna GPU Nvidia. En la versión anterior de nvcc tiene un indicador --multicore para compilar código cuda para CPU. En la nueva versión de nvcc, ¿cuál es la opción? Estoy trabajando en Linux.

sorting cub

1 la respuesta

cub BlockRadixSort: ¿cómo lidiar con un gran tamaño de mosaico u ordenar múltiples mosaicos?

Cuando se usa cub :: BlockRadixSort para ordenar dentro de un bloque, si el número de elementos es demasiado grande, ¿cómo lidiamos con eso? Si configuramos un tamaño de mosaico para que sea demasiado grande, la memoria compartida para el ...

Página 32 de 58

30 313233 34

Resultados de la búsqueda a petición "cuda"

¿Cómo convertir ciclos de reloj CUDA a milisegundos?

CUDA asigna memoria en la función dispositivo

Buscar una matriz ordenada en un núcleo CUDA

Etiquetas Populares

printf dentro de la función global de CUDA

Se creó un contexto CUDA en una GPU que actualmente no se puede depurar

Cómo estructurar datos para una velocidad óptima en una aplicación CUDA

¿Hacer CUB blockradixsort en chip por completo?

Calcular el espacio nulo de una matriz lo más rápido posible

Compilar código cuda para CPU

cub BlockRadixSort: ¿cómo lidiar con un gran tamaño de mosaico u ordenar múltiples mosaicos?

¡Eres muy activo! ¡Es genial!

Resultados de la búsqueda a petición "cuda"

Etiquetas Populares