Resultados de la búsqueda a petición "opencl"
Uso de Keras y Tensorflow con GPU AMD
Estoy empezando a aprender Keras, que creo que es una capa encima de Tensorflow y Theano. Sin embargo, solo tengo acceso a las GPU AMD como la AMD R9 280X. ¿Cómo puedo configurar mi entorno Python de modo que pueda usar mis GPU AMD a través del ...
¿Qué es un conflicto bancario? (Haciendo programación Cuda / OpenCL)
He estado leyendo la guía de programación para CUDA y OpenCL, y no puedo entender qué es un conflicto bancario. Simplemente se sumergen en cómo resolver el problema sin dar más detalles sobre el tema en sí. ¿Alguien puede ayudarme a entenderlo? ...
Preguntas sobre el tamaño del trabajo global y local.
Buscando en los foros de NVIDIA encontréestas preguntas [http://forums.nvidia.com/index.php?showtopic=182920&pid=1132050&mode=threaded&show=&st=#entry1132050] , que también son de mi interés, pero nadie les había respondido en los últimos cuatro ...
obteniendo el error "se configuró pygpu pero no se pudo importar" al intentar con OpenCL + Theano en AMD Radeon
He seguido las instrucciones de esto: https://gist.github.com/jarutis/ff28bca8cfb9ce0c8b1a [https://gist.github.com/jarutis/ff28bca8cfb9ce0c8b1a] Pero luego cuando intenté: THEANO_FLAGS = device = opencl0: 0 python test.py en el archivo de ...
¿Cuál es la diferencia entre crear un objeto de búfer con clCreateBuffer + CL_MEM_COPY_HOST_PTR frente a clCreateBuffer + clEnqueueWriteBuffer?
He visto ambas versiones en tutoriales, pero no pude averiguar cuáles son sus ventajas y desventajas. ¿Cuál es el correcto? cl_mem input = clCreateBuffer(context,CL_MEM_READ_ONLY,sizeof(float) * DATA_SIZE, NULL, NULL); ...
¿Cuántos ciclos de latencia de memoria por tipo de acceso a memoria en OpenCL / CUDA?
Revisé la guía de programación y la guía de mejores prácticas y mencionó que el acceso a la memoria global demora entre 400 y 600 ciclos. No vi mucho en los otros tipos de memoria como caché de textura, caché constante, memoria compartida. Los ...
Comprender el uso de OpenCL en OpenCV (objetos Mat / Umat)
Ejecuté el siguiente código para verificar la diferencia de rendimiento entre el uso de GPU y CPU. Estoy calculando el tiempo promedio paracv::cvtColor() función. Realizo cuatro llamadas a funciones: Just_mat()(Sin usar OpenCL paraMat ...
Cómo perfilar la aplicación OpenCL con CUDA 8.0 nvprof
Estoy tratando de perfilar la aplicación OpenCL,a.out, en un sistema con NVIDIA TITAN X y CUDA 8.0. Si fue la aplicación CUDA,nvprof ./a.out seria suficiente. Pero descubrí que esto no funciona con la aplicación OpenCL, con un mensaje "No se ...