Resultados de la búsqueda a petición "opencl"

1 la respuesta

OpenCL: elementos de trabajo, elementos de procesamiento, NDRange

4 la respuesta

Transfiera datos desde Mat / oclMat a cl_mem (OpenCV + OpenCL)

7 la respuesta

Uso de Keras y Tensorflow con GPU AMD

Estoy empezando a aprender Keras, que creo que es una capa encima de Tensorflow y Theano. Sin embargo, solo tengo acceso a las GPU AMD como la AMD R9 280X. ¿Cómo puedo configurar mi entorno Python de modo que pueda usar mis GPU AMD a través del ...

5 la respuesta

¿Qué es un conflicto bancario? (Haciendo programación Cuda / OpenCL)

He estado leyendo la guía de programación para CUDA y OpenCL, y no puedo entender qué es un conflicto bancario. Simplemente se sumergen en cómo resolver el problema sin dar más detalles sobre el tema en sí. ¿Alguien puede ayudarme a entenderlo? ...

1 la respuesta

Preguntas sobre el tamaño del trabajo global y local.

Buscando en los foros de NVIDIA encontréestas preguntas [http://forums.nvidia.com/index.php?showtopic=182920&pid=1132050&mode=threaded&show=&st=#entry1132050] , que también son de mi interés, pero nadie les había respondido en los últimos cuatro ...

2 la respuesta

obteniendo el error "se configuró pygpu pero no se pudo importar" al intentar con OpenCL + Theano en AMD Radeon

He seguido las instrucciones de esto: https://gist.github.com/jarutis/ff28bca8cfb9ce0c8b1a [https://gist.github.com/jarutis/ff28bca8cfb9ce0c8b1a] Pero luego cuando intenté: THEANO_FLAGS = device = opencl0: 0 python test.py en el archivo de ...

5 la respuesta

¿Cuál es la diferencia entre crear un objeto de búfer con clCreateBuffer + CL_MEM_COPY_HOST_PTR frente a clCreateBuffer + clEnqueueWriteBuffer?

He visto ambas versiones en tutoriales, pero no pude averiguar cuáles son sus ventajas y desventajas. ¿Cuál es el correcto? cl_mem input = clCreateBuffer(context,CL_MEM_READ_ONLY,sizeof(float) * DATA_SIZE, NULL, NULL); ...

2 la respuesta

¿Cuántos ciclos de latencia de memoria por tipo de acceso a memoria en OpenCL / CUDA?

Revisé la guía de programación y la guía de mejores prácticas y mencionó que el acceso a la memoria global demora entre 400 y 600 ciclos. No vi mucho en los otros tipos de memoria como caché de textura, caché constante, memoria compartida. Los ...

1 la respuesta

Comprender el uso de OpenCL en OpenCV (objetos Mat / Umat)

Ejecuté el siguiente código para verificar la diferencia de rendimiento entre el uso de GPU y CPU. Estoy calculando el tiempo promedio paracv::cvtColor() función. Realizo cuatro llamadas a funciones: Just_mat()(Sin usar OpenCL paraMat ...

1 la respuesta

Cómo perfilar la aplicación OpenCL con CUDA 8.0 nvprof

Estoy tratando de perfilar la aplicación OpenCL,a.out, en un sistema con NVIDIA TITAN X y CUDA 8.0. Si fue la aplicación CUDA,nvprof ./a.out seria suficiente. Pero descubrí que esto no funciona con la aplicación OpenCL, con un mensaje "No se ...