Resultados de la búsqueda a petición "cuda"

2 la respuesta

Varias versiones de CUDA en la máquina nvcc -V confusión

Solía tener cuda-7.0 instalado en mi máquina y luego desinstalar cuda-7.0 e instalar cuda-8.0. Cuando voy a mi carpeta / usr / local, veo las siguientes carpetas: /bin/ /cuda/ /cuda-7.0/ /cuda-8.0/ /etc/ /games/ /include/ /lib/ /lua/ ...

1 la respuesta

Cómo perfilar la aplicación OpenCL con CUDA 8.0 nvprof

Estoy tratando de perfilar la aplicación OpenCL,a.out, en un sistema con NVIDIA TITAN X y CUDA 8.0. Si fue la aplicación CUDA,nvprof ./a.out seria suficiente. Pero descubrí que esto no funciona con la aplicación OpenCL, con un mensaje "No se ...

6 la respuesta

Ubuntu 16.04, CUDA 8 - La versión del controlador CUDA es insuficiente para la versión de tiempo de ejecución CUDA

He instalado los últimos controladores de nvidia (375.26) manualmente, e instalé CUDA usando cuda_8.0.44_linux.run (omitiendo la instalación del controlador allí, ya que los controladores incluidos son más antiguos, 367 creo). Sin embargo, la ...

1 la respuesta

nvidia-smi ¿Explicación de utilización de GPU volátil?

Yo sé esonvidia-smi -l 1 dará el uso de la GPU cada segundo (de manera similar a lo siguiente). Sin embargo, agradecería una explicación sobre quéVolatile GPU-Util realmente significa. ¿Es ese el número de SM usados sobre el total de SM, o la ...

1 la respuesta

Función CUDA activable por el dispositivo o el host

Tengo una función reutilizable en algún código CUDA que debe llamarse tanto desde el dispositivo como desde el host. ¿Hay un calificador apropiado para esto? p.ej. ¿Cuál es la definición correcta para func1 en este caso? int func1 (int a, int ...

1 la respuesta

Iterando a través de una matriz 2D en PyCUDA

Estoy tratando de iterar a través de una matriz 2D en PyCUDA pero termino con valores de matriz repetidos. Inicialmente lanzo una pequeña matriz entera aleatoria y eso funciona como se esperaba, pero cuando le lanzo una imagen, veo los mismos ...

2 la respuesta

¿Comenzar 1 subproceso por elemento siempre es óptimo para problemas independientes de datos en la GPU?

Estaba escribiendo un kernel de memcpy simple para medir el ancho de banda de memoria de mi GTX 760M y compararlo con cudaMemcpy (). Se ve así: template<unsigned int THREADS_PER_BLOCK> __global__ static void copy(void* src, void* dest, unsigned ...

1 la respuesta

¿Cómo puedo usar TensorFlow sin CUDA en Linux?

Tengo dos computadoras sin CUDA: una se ejecuta en Microsoft Windows, la otra se ejecuta en Linux (Ubuntu 14.04 64bit / Linux 3.13.0-100-generic)) Puedo usar TensorFlow sin CUDA en Microsoft Windows sin ningún problema: TensorFlow usa la CPU. ...

4 la respuesta

CUDA determinando hilos por bloque, bloques por cuadrícula

Soy nuevo en el paradigma de CUDA. Mi pregunta es determinar el número de subprocesos por bloque y los bloques por cuadrícula. ¿Un poco de arte y prueba juega con esto? Lo que he encontrado es que muchos ejemplos tienen un número aparentemente ...

1 la respuesta

aplicación simple de cuda que funciona para 32 bits, no para 64 bits

Mi aplicación simple cuda helloworld funciona bien cuando está construida en 32 bits usando la comunidad visual studio 2015 en windows 10. Sin embargo, si la construyo en 64 bits, no se ejecuta GPU: Telsa K40c Kit de herramientas: CUDA ...