Resultados de la búsqueda a petición "gpgpu"

1 la respuesta

nvidia-smi ¿Explicación de utilización de GPU volátil?

Yo sé esonvidia-smi -l 1 dará el uso de la GPU cada segundo (de manera similar a lo siguiente). Sin embargo, agradecería una explicación sobre quéVolatile GPU-Util realmente significa. ¿Es ese el número de SM usados sobre el total de SM, o la ...

2 la respuesta

¿Comenzar 1 subproceso por elemento siempre es óptimo para problemas independientes de datos en la GPU?

Estaba escribiendo un kernel de memcpy simple para medir el ancho de banda de memoria de mi GTX 760M y compararlo con cudaMemcpy (). Se ve así: template<unsigned int THREADS_PER_BLOCK> __global__ static void copy(void* src, void* dest, unsigned ...

1 la respuesta

Pasar dos opciones como argumentos en OpenCL con Fortran (CLFORTRAN)

Cuando mi programa host está en lenguaje C, puedo pasar dos opciones como argumento de una función OpenCL. Por ejemplo, puedo pasar dos banderas alclCreateBuffer funciona así: clCreateBuffer(context, CL_MEM_READ_ONLY | ...

6 la respuesta

Dividiendo eficientemente el valor sin signo por una potencia de dos, redondeando - en CUDA

Solo estaba leyendo: Dividiendo eficientemente el valor sin signo por una potencia de dos, redondeando [https://stackoverflow.com/questions/40431599/efficiently-dividing-unsigned-value-by-a-power-of-two-rounding-up] y me preguntaba cuál era la ...

1 la respuesta

¿Existe una relación entre en qué dispositivo se creó la transmisión y en qué dispositivo ejecutará el código?

Si uso este código, ¿se ejecutará en el dispositivo 0 o 1? cudaSetDevice(0); // switch to device 0 cudaStream_t stream1; cudaStreamCreate(&stream1); // created on device 0 cudaSetDevice(1); // switch to device 1 kernel_function<<<10, 1024, 0, ...

1 la respuesta

¿Cuál es la diferencia entre cudaMemcpy () y cudaMemcpyPeer () para la copia P2P?

Quiero copiar datos de GPU0-DDR a GPU1-DDR directamente sin CPU-RAM. Como se dijo aquí en la página ...

2 la respuesta

Código GPGPU no confiable (OpenCL, etc.): ¿es seguro? Que riesgos

Hay muchos enfoques cuando se trata de ejecutar código no confiable en una CPU típica: cajas de arena, raíces falsas, virtualización ... ¿Qué pasa con el código no confiable para GPGPU (OpenCL, cuda o ya compilado)? Suponiendo que la memoria en ...

1 la respuesta

cudaMemcpyFromSymbol en una variable __device__

Estoy tratando de aplicar una función de kernel en un__device__ variable que, según las especificaciones, reside "en la memoria global" #include <stdio.h> #include "sys_data.h" #include "my_helper.cuh" #include "helper_cuda.h" #include ...

2 la respuesta

Multiplicación de vectores de matriz en CUDA: evaluación comparativa y rendimiento

Estoy actualizando mi pregunta con algunos resultados nuevos de evaluación comparativa (también reformulé la pregunta para que sea más específica y actualicé el código) ... Implementé un núcleo para la multiplicación de matriz-vector en CUDA C ...

2 la respuesta

¿Por qué debería usar la API del controlador CUDA en lugar de la API de tiempo de ejecución CUDA?

¿Por qué debería usar la API del controlador CUDA y en qué casos no puedo usar la API de tiempo de ejecución CUDA (que es más conveniente que la API del controlador)?