Resultados de la búsqueda a petición "cuda"
JIT en JCuda, cargando múltiples módulos ptx
Dije enesta [https://stackoverflow.com/questions/32502375/loading-multiple-modules-in-jcuda-is-not-working] pregunta que tuve algún problema al cargar módulos ptx en JCuda y después de la idea de @ talonmies, implementé una versión JCuda de su ...
¿Cómo observar los eventos y métricas de CUDA para una subsección de un ejecutable (por ejemplo, solo durante un tiempo de ejecución del núcleo)?
Estoy familiarizado con el uso de nvprof para acceder a los eventos y las métricas de un punto de referencia, por ejemplo, nvprof --system-profiling on --print-gpu-trace -o (file name) --events inst_issued1 ./benchmarknamelos system-profiling ...
¿Alguien puede proporcionar un código de muestra que demuestre el uso de coma flotante de 16 bits en cuda?
Cuda 7.5 admite variables de punto flotante de 16 bits. ¿Alguien puede proporcionar un código de muestra que demuestre su uso?
¿Cómo explico la variabilidad del rendimiento en el bus PCIe?
En mi programa CUDA, veo una gran variabilidad entre diferentes ejecuciones (hasta 50%) en el tiempo de comunicación, que incluye tiempos de transferencia de datos de host a dispositivo y de dispositivo a host a través de PCI Express para memoria ...
aplicación de la función cuda por elementos en cuda
Después de multiplicar una matriz A y un vector x obteniendo el resultado y, quiero aplicar una función h elemento a y. Quiero obtener z = h (Ax), donde h se aplica por elementos al vector AX. Sé cómo hacer la multiplicación de matriz / vector ...
Punteros en estructuras pasadas a CUDA
He estado jugando con esto por un tiempo, pero parece que no puedo hacerlo bien. Estoy tratando de copiar objetos que contienen matrices en la memoria del dispositivo CUDA (y de regreso, pero cruzaré ese puente cuando llegue a él): struct MyData ...
Acerca del código de error "función de dispositivo no válida" de nvcc con la opción de compilación compute_ y sm_
Espero que me puedan ayudar a descubrir la opción correcta del compilador requerida para la siguiente tarjeta: > ./deviceQuery Starting... > > CUDA Device Query (Runtime API) version (CUDART static linking) > > Detected 1 CUDA Capable device(s) ...
Use cmake para configurar el proyecto cuda para vs2013 y obtenga el error "función de dispositivo no válido"
Utilizo la herramienta cmake gui para configurar mi proyecto cuda en vs2013. CMakeLists.txt es el siguiente: project(CUDA_PART) # required cmake version cmake_minimum_required(VERSION 3.0) include_directories(${CUDA_PART_SOURCE_DIR}/common) # ...
CUDA que estima hilos por bloques y números de bloque para datos de cuadrícula 2D
Permítanme comenzar diciendo que he leído cuidadosamente todas las preguntas similares sobre SO: Determinación de subprocesos por bloque y bloque por ...
¿Qué puedo hacer contra 'La versión del controlador CUDA es insuficiente para la versión de tiempo de ejecución CUDA'?
Cuando voy a/usr/local/cuda/samples/1_Utilities/deviceQuery y ejecutar moose@pc09 /usr/local/cuda/samples/1_Utilities/deviceQuery $ sudo make clean rm -f deviceQuery deviceQuery.o rm -rf ../../bin/x86_64/linux/release/deviceQuery moose@pc09 ...