Resultados de la búsqueda a petición "cuda"

1 la respuesta

JIT en JCuda, cargando múltiples módulos ptx

Dije enesta [https://stackoverflow.com/questions/32502375/loading-multiple-modules-in-jcuda-is-not-working] pregunta que tuve algún problema al cargar módulos ptx en JCuda y después de la idea de @ talonmies, implementé una versión JCuda de su ...

2 la respuesta

¿Cómo observar los eventos y métricas de CUDA para una subsección de un ejecutable (por ejemplo, solo durante un tiempo de ejecución del núcleo)?

Estoy familiarizado con el uso de nvprof para acceder a los eventos y las métricas de un punto de referencia, por ejemplo, nvprof --system-profiling on --print-gpu-trace -o (file name) --events inst_issued1 ./benchmarknamelos system-profiling ...

1 la respuesta

¿Alguien puede proporcionar un código de muestra que demuestre el uso de coma flotante de 16 bits en cuda?

Cuda 7.5 admite variables de punto flotante de 16 bits. ¿Alguien puede proporcionar un código de muestra que demuestre su uso?

1 la respuesta

¿Cómo explico la variabilidad del rendimiento en el bus PCIe?

En mi programa CUDA, veo una gran variabilidad entre diferentes ejecuciones (hasta 50%) en el tiempo de comunicación, que incluye tiempos de transferencia de datos de host a dispositivo y de dispositivo a host a través de PCI Express para memoria ...

1 la respuesta

aplicación de la función cuda por elementos en cuda

Después de multiplicar una matriz A y un vector x obteniendo el resultado y, quiero aplicar una función h elemento a y. Quiero obtener z = h (Ax), donde h se aplica por elementos al vector AX. Sé cómo hacer la multiplicación de matriz / vector ...

2 la respuesta

Punteros en estructuras pasadas a CUDA

He estado jugando con esto por un tiempo, pero parece que no puedo hacerlo bien. Estoy tratando de copiar objetos que contienen matrices en la memoria del dispositivo CUDA (y de regreso, pero cruzaré ese puente cuando llegue a él): struct MyData ...

1 la respuesta

Acerca del código de error "función de dispositivo no válida" de nvcc con la opción de compilación compute_ y sm_

Espero que me puedan ayudar a descubrir la opción correcta del compilador requerida para la siguiente tarjeta: > ./deviceQuery Starting... > > CUDA Device Query (Runtime API) version (CUDART static linking) > > Detected 1 CUDA Capable device(s) ...

1 la respuesta

Use cmake para configurar el proyecto cuda para vs2013 y obtenga el error "función de dispositivo no válido"

Utilizo la herramienta cmake gui para configurar mi proyecto cuda en vs2013. CMakeLists.txt es el siguiente: project(CUDA_PART) # required cmake version cmake_minimum_required(VERSION 3.0) include_directories(${CUDA_PART_SOURCE_DIR}/common) # ...

1 la respuesta

CUDA que estima hilos por bloques y números de bloque para datos de cuadrícula 2D

Permítanme comenzar diciendo que he leído cuidadosamente todas las preguntas similares sobre SO: Determinación de subprocesos por bloque y bloque por ...

4 la respuesta

¿Qué puedo hacer contra 'La versión del controlador CUDA es insuficiente para la versión de tiempo de ejecución CUDA'?

Cuando voy a/usr/local/cuda/samples/1_Utilities/deviceQuery y ejecutar moose@pc09 /usr/local/cuda/samples/1_Utilities/deviceQuery $ sudo make clean rm -f deviceQuery deviceQuery.o rm -rf ../../bin/x86_64/linux/release/deviceQuery moose@pc09 ...