Resultados de la búsqueda a petición "cuda"
CUDA que estima hilos por bloques y números de bloque para datos de cuadrícula 2D
Permítanme comenzar diciendo que he leído cuidadosamente todas las preguntas similares sobre SO: Determinación de subprocesos por bloque y bloque por ...
omando @top para GPU's usando CUDA
Estoy tratando de monitorear un proceso que usa cuda y MPI, ¿hay alguna forma de que pueda hacer esto, algo como el comando "top" pero que también monitorea la GPU?
cudaMemset falla en la variable __device__
Tengo problemas para usarcudaMemset en una variable de dispositivo. ¿Es posible usar la referencia a la variable de dispositivo paracudaMemset, o es solo una cuestión de falta de indicadores del compilador, o bibliotecas ... Estoy usando cuda ...
Ordenar objetos con Thrust CUDA
¿Es posible ordenar objetos usando la biblioteca Thrust? Tengo la siguiente estructura: struct OB{ int N; Cls *C; //CLS is another struct. } ¿Es posible usar el empuje para ordenar una matriz de OB según N? ¿Puede proporcionar un ejemplo ...
CUDA: llamando a la función de biblioteca en el kernel
Sé que existe la restricción de llamar solo__device__ funciones en el kernel. Esto me impide llamar a funciones estándar comostrcmp() y así sucesivamente en el núcleo. En este momento no puedo entender / encontrar las razones para esto. ...
¿'Code = sm_X' incorpora solo código binario (cubin), o también código PTX, o ambos?
Estoy un poco confundido acerca de la opción 'code = sm_X' dentro de la declaración '-gencode'. Un ejemplo: ¿Qué significa la opción del compilador NVCC -gencode arch=compute_13,code=sm_13incrustar en la biblioteca? Solo el código de máquina ...
error MSB3721 al crear muestras CUDA para VS2010, WINDOWS7, 64BIT
He instalado CUDA 5.5 Production Release con la estructura de directorio de instalación predeterminada. Luego, sigo la Guía de inicio de NVIDIA CUDA para Mic...
¿por qué no puedo obtener la suma correcta de matriz 1D con numba (cuda python)?
Intento usar cuda python con numba. El código es calcular la suma de una matriz 1D de la siguiente manera, pero no sé cómo obtener un resultado de valor en lugar de tres valores. python3.5 con numba + CUDA8.0 import os,sys,time import pandas as ...
El lanzamiento del kernel CUDA falla cuando se usan varias compensaciones en los datos de entrada
Mi código muestra un mensaje de error y estoy tratando de localizar la causa. Para que sea más fácil encontrar el problema, eliminé el código que aparentemen...
Punteros en estructuras pasadas a CUDA
He estado jugando con esto por un tiempo, pero parece que no puedo hacerlo bien. Estoy tratando de copiar objetos que contienen matrices en la memoria del dispositivo CUDA (y de regreso, pero cruzaré ese puente cuando llegue a él): struct MyData ...