Resultados de la búsqueda a petición "cuda"

3 la respuesta

¿Cuántos 'núcleos CUDA' tiene cada multiprocesador de una GPU?

Sé que los dispositivos anteriores a la arquitectura Fermi tenían 8 SP en un solo multiprocesador. ¿Es el recuento igual en la arquitectura de Fermi?

1 la respuesta

CUDA HOME en la instalación de pytorch

I instalé pytorch a través de conda con cuda 7.5 conda install pytorch=0.3.0 cuda75 -c pytorch >>> import torch >>> torch.cuda.is_available() TrueNo hice ninguna otra instalación para cuda que no sea esta, ya que parece que pytorch viene con ...

1 la respuesta

CUDA __threadfence ()

Repasé muchas publicaciones en el foro y la documentación de NVIDIA, pero no pude entender qué__threadfence() hace y cómo usarlo. ¿Alguien podría explicar cuál es el propósito de ese intrínseco?

2 la respuesta

¿Puede CUDA usar extensiones SIMD?

Busco en Google un poco, pero ahora no tengo claro si algunas GPU programadas con CUDA pueden aprovechar o pueden usar instrucciones similares a las de las extensiones SSE SIMD; por ejemplo, si podemos resumir dos vectores de flotadores en doble ...

2 la respuesta

factor de escala para CUFFT

Escribí un programa de prueba simple, donde estaba haciendo FT complejos a complejos y simplemente generé algunos datos 1..50 y los pegué en la parte real e imaginaria para cada índice de la matriz. Cuando hago una operación como esta IFFT (FFT ...

2 la respuesta

¿Se ejecutan los subprocesos en una urdimbre CUDA en paralelo en un multiprocesador?

Una urdimbre es de 32 hilos. ¿Los 32 subprocesos se ejecutan en paralelo en un multiprocesador? Si 32 hilos no se ejecutan en paralelo, entonces no hay condición de carrera en la urdimbre. Tengo esta duda después de leer algunos ejemplos.

5 la respuesta

Ordenar objetos con Thrust CUDA

¿Es posible ordenar objetos usando la biblioteca Thrust? Tengo la siguiente estructura: struct OB{ int N; Cls *C; //CLS is another struct. } ¿Es posible usar el empuje para ordenar una matriz de OB según N? ¿Puede proporcionar un ejemplo ...

4 la respuesta

¿Cuál es un buen algoritmo de clasificación en CUDA?

Tengo una matriz de struct y necesito ordenar esta matriz de acuerdo con una propiedad de la struct (N). El objeto se ve así: struct OBJ { int N; //sort array of OBJ with respect to N OB *c; //OB is another struct }El tamaño de la matriz es ...

2 la respuesta

CUDA: Usando realloc dentro del kernel

Sé que es posible usarmalloc dentro del núcleo para asignar memoria en la memoria global de la GPU. ¿También es posible usarrealloc?

1 la respuesta

thrust establece la diferencia no se compila con la llamada a una función __host__ desde una función __host__ __device__ no está permitido

Tengo dos conjuntos A y B de 20 y 10 enteros respectivamente. B es un subconjunto de A. Necesito encontrar el conjunto complementario de B. Uso thrust :: set_difference para encontrar la diferencia de conjunto. Sin embargo, no se compila con el ...