Resultados de la búsqueda a petición "cuda"
¿Puedo asignar memoria del dispositivo usando OpenCL y usar punteros a la memoria en CUDA?
Digamos que uso OpenCL para administrar la memoria (para que la administración de memoria entre GPU / CPU use el mismo código), pero mi cálculo usa CUDA y código de CPU optimizados (no OpenCL). ¿Puedo seguir usando los punteros de memoria del ...
Error de enlace CUDA - Visual Express 2008 - nvcc fatal debido al archivo de configuración (nulo)
He estado buscando extensamente una posible solución a mi error durante las últimas 2 semanas. He instalado con éxito el compilador de Cuda de 64 bits (herramientas) y el SDK, así como la versión de 64 bits de Visual Studio Express 2008 y Windows ...
La función getrs de cuSolver sobre pycuda no funciona correctamente
Estoy tratando de hacer un envoltorio de pycuda inspirado en la biblioteca scikits-cuda para algunas operaciones proporcionadas en la nueva biblioteca cuSolver de Nvidia. Quiero resolver un sistema lineal de la forma AX = B por factorización LU, ...
CUDA: evitar la ejecución en serie en la divergencia de rama
Suponga que un kernel CUDA ejecutado por una sola deformación (por simplicidad) alcanza unif-else declaración, donde 20 de los hilos dentro de la urdimbre satisfacencondition y 32-20 = 12 hilos no: if (condition){ statement1; // executed by 20 ...
Entero min / max en CUDA
Veo en elAPI de matemáticas CUDA [http://docs.nvidia.com/cuda/cuda-math-api/group__CUDA__MATH__SINGLE.html#group__CUDA__MATH__SINGLE_1gef4476ab1d2818b60097fdc4064a395a] documentación de que existen funciones para operaciones mínimas / máximas ...
CUDA: asignación de memoria del dispositivo de envoltura en C ++
Estoy empezando a usar CUDA en este momento y tengo que admitir que estoy un poco decepcionado con la API de C. Entiendo las razones para elegir C, pero si el lenguaje se hubiera basado en C ++, varios aspectos habrían sido mucho más simples, p. ...
Plantilla __host__ __dispositivo__ llamando a funciones definidas por el host
Durante la implementación del código CUDA, a menudo necesito algunas funciones de utilidad, que se llamarán desde el dispositivo y también desde el código del host. Entonces declaro estas funciones como__host__ __dispositivo__. Esto está bien y ...
Asignación de memoria en GPU para matriz dinámica de estructuras
Tengo un problema al pasar la matriz de struct al kernel de gpu. Me basé en este tema:falla de segmentación de cudaMemcpy [https://stackoverflow.com/questions/15431365/cudamemcpy-segmentation-fault]y escribí algo así: #include <stdio.h> #include ...
Cuda cusolver no se puede vincular en Visual Studio 2013
Básicamente lo he intentado todo y no puedo obtener vs2013 para compilar y vincular contra la biblioteca cusolver. He probado todos los proyectos de muestra que vienen con el paquete de instalación de cuda y, básicamente, todas las muestras ...
Expresiones lambda con CUDA
Si yo usothrust::transform enthrust::host, el uso de lambda está bien thrust::transform(thrust::host, a, a+arraySize,b,d,[](int a, int b)->int { return a + b; });Sin embargo, si cambiothrust::host athrust::device, el código no pasaría el ...