Resultados de la búsqueda a petición "cuda"
CUDA: uso de cudaEvent_t y cudaThreadSynchronize
Estoy un poco confundido sobre el uso decudaEvent_t. Actualmente, estoy usando laclock() llame así para encontrar la duración de una llamada del núcleo: cudaThreadSynchronize(); clock_t begin = clock(); fooKernel<<< x, y >>>( z, w ...
Qué ejecutan los elementos de trabajo cuando se usan condicionales en la programación de GPU?
Si tiene elementos de trabajo ejecutándose en un frente de onda y hay un condicional como: if(x){ ... } else{ .... } ¿Qué ejecutan los elementos de trabajo? ¿Es el caso mediante el cual todos los elementos de trabajo en el frente de onda ...
Programando CUDA usando Delphi o FreePascal
¿Puedo crear aplicaciones CUDA / OpenCL usando Delphi o FreePascal? ¿O me veo obligado a usar C ++ y Visual Studio? Una búsqueda rápida:cuda + pascal [http://www.google.com/search?btnG=1&pws=0&q=cuda%20pascal] Resulta algunos prospectos ...
PyCUDA + Threading = Invalid Handles en invocaciones de kernel
Intentaré aclarar esto; Tengo dos clases; @GPU(Object), para acceso general a la funcionalidad de la GPU, ymultifunc(threading.Thread) para una función particular que estoy tratando de usar en varios dispositivos. @GPU contiene la mayor parte ...
Python GPU programación [cerrado]
Actualmente estoy trabajando en un proyecto en Python, y me gustaría utilizar la GPU para algunos cálculos. A primera vista parece que hay muchas herramientas disponibles; a segunda vista, siento que me falta algo. Copperhead se ve increíble, ...
Error compilando Cuda - expresión primaria esperada
Este programa parece estar bien, pero sigo recibiendo un error, ¿alguna sugerencia? Programa #include "dot.h" #include <cuda.h> #include <cuda_runtime.h> #include <stdio.h> int main(int argc, char** argv) { int *a, *b, *c; int *dev_a, *dev_b, ...
CUDA Llamadas externas no admitidas
Estoy desarrollando una aplicación CUDA 4.0 que se ejecuta en una tarjeta Fermi. De acuerdo con las especificaciones, Fermi tiene Compute Capability 2.0 y, por lo tanto, debe admitir llamadas de función no en línea. Compilo todas las clases ...
CUDA - memcpy2d - tono equivocado
Acabo de comenzar la programación de CUDA e intentaba ejecutar el código que se muestra a continuación. La idea es copiar una matriz bidimensional en el dispositivo, calcular la suma de todos los elementos y recuperar la suma después (sé que ...
CUDA transferencia de dispositivo a dispositivo costosa
He escrito un código para intentar intercambiar cuadrantes de una matriz 2D con fines FFT, que se almacena en una matriz plana. int leftover = W-dcW; T *temp; T *topHalf; cudaMalloc((void **)&temp, dcW * sizeof(T)); //swap every row, left and ...
¿Cómo puedo sumar dos matrices 2d (inclinadas) usando bucles anidados para?
Soy nuevo en Cuda. Quiero sumar dos conjuntos 2d en un tercer conjunto. Yo uso el siguiente código: cudaMallocPitch((void**)&device_a, &pitch, 2*sizeof(int),2); cudaMallocPitch((void**)&device_b, &pitch, ...