Resultados de la búsqueda a petición "cuda"

2 la respuesta

Implementación de tabla hash para GPU [cerrado]

Estoy buscando una implementación de tabla hash que pueda usar para la codificación CUDA. ¿Hay alguien bueno por ahí? Algo así como el diccionario Python. Usaré cadenas como mis llaves

1 la respuesta

Eficiencia de la función Malloc en CUDA

Estoy intentando transferir algunos códigos de CPU a CUDA. Mi tarjeta CUDA se basa en la arquitectura Fermi y, por lo tanto, puedo usar la función malloc () en el dispositivo para asignar memoria de forma dinámica y no necesito cambiar mucho los ...

1 la respuesta

OpenCV CUDA funciona más lento que OpenCV CPU

He estado luchando para obtener OpenCV CUDA para mejorar el rendimiento de cosas como erosionar / dilatar, diferenciar cuadros, etc. cuando leo un video de un archivo avi. Típicamente obtengo la mitad del FPS en la GPU (580gtx) que en la CPU ...

3 la respuesta

Cuentas de números en una matriz CUDA

Tengo una matriz de enteros sin signo almacenados en la GPU con CUDA (normalmente1000000 elementos). Me gustaría contar la aparición de cada número en la matriz. Solo hay unos pocos números distintos (aproximadamente10), pero estos números ...

4 la respuesta

El ejemplo más simple posible para mostrar que la GPU supera a la CPU con CUDA

Estoy buscando la cantidad de código más concisa posible que pueda codificarse tanto para una CPU (usando g ++) como para una GPU (usando nvcc) para la cual la GPU supera constantemente a la CPU. Cualquier tipo de algoritmo es aceptable. Para ...

1 la respuesta

¿Cuánta memoria puedo asignar realmente en una tarjeta Cuda?

Estoy escribiendo un proceso de servidor que realiza cálculos en una GPU usando cuda. Quiero poner en cola las solicitudes entrantes hasta que haya suficiente memoria disponible en el dispositivo para ejecutar el trabajo, pero me resulta difícil ...

2 la respuesta

Encontrar el valor máximo del elemento Y su posición usando CUDA Thrust

¿Cómo obtengo no solo el valor sino también la posición del elemento máximo (mínimo) res.val yres.pos)? thrust::host_vector<float> h_vec(100); thrust::generate(h_vec.begin(), h_vec.end(), rand); thrust::device_vector<float> d_vec = h_vec; T res ...

1 la respuesta

Error: BFS en sincronización CUDA

Mi siguiente código recibió un error, cuando se ejecuta, algunos de los pesos de los gráficos se están sobrescribiendo, pero eso no debería estar sucediendo con la matriz Xa (que mantiene cuáles ya han sido visitados) y la función __syncthreads ...

2 la respuesta

¿Dónde asigna CUDA el marco de pila para los núcleos?

Mi llamada al kernel falla con "memoria insuficiente". Hace un uso significativo del marco de la pila y me preguntaba si esta es la razón de su falla. Al invocar nvcc con --ptxas-options = -v, imprime la siguiente información ...

5 la respuesta

Timing operaciones CUDA

Necesito cronometrar la ejecución de un núcleo CUDA. La Guía de mejores prácticas dice que podemos usar eventos o funciones de sincronización estándar comoclock() en Windows. Mi problema es que usar estas dos funciones me da un resultado ...