Resultados de la búsqueda a petición "cuda"

1 la respuesta

CUDA: uso de cudaEvent_t y cudaThreadSynchronize

Estoy un poco confundido sobre el uso decudaEvent_t. Actualmente, estoy usando laclock() llame así para encontrar la duración de una llamada del núcleo: cudaThreadSynchronize(); clock_t begin = clock(); fooKernel<<< x, y >>>( z, w ...

1 la respuesta

Qué ejecutan los elementos de trabajo cuando se usan condicionales en la programación de GPU?

Si tiene elementos de trabajo ejecutándose en un frente de onda y hay un condicional como: if(x){ ... } else{ .... } ¿Qué ejecutan los elementos de trabajo? ¿Es el caso mediante el cual todos los elementos de trabajo en el frente de onda ...

4 la respuesta

Programando CUDA usando Delphi o FreePascal

¿Puedo crear aplicaciones CUDA / OpenCL usando Delphi o FreePascal? ¿O me veo obligado a usar C ++ y Visual Studio? Una búsqueda rápida:cuda + pascal [http://www.google.com/search?btnG=1&pws=0&q=cuda%20pascal] Resulta algunos prospectos ...

2 la respuesta

PyCUDA + Threading = Invalid Handles en invocaciones de kernel

Intentaré aclarar esto; Tengo dos clases; @GPU(Object), para acceso general a la funcionalidad de la GPU, ymultifunc(threading.Thread) para una función particular que estoy tratando de usar en varios dispositivos. @GPU contiene la mayor parte ...

7 la respuesta

Python GPU programación [cerrado]

Actualmente estoy trabajando en un proyecto en Python, y me gustaría utilizar la GPU para algunos cálculos. A primera vista parece que hay muchas herramientas disponibles; a segunda vista, siento que me falta algo. Copperhead se ve increíble, ...

4 la respuesta

Error compilando Cuda - expresión primaria esperada

Este programa parece estar bien, pero sigo recibiendo un error, ¿alguna sugerencia? Programa #include "dot.h" #include <cuda.h> #include <cuda_runtime.h> #include <stdio.h> int main(int argc, char** argv) { int *a, *b, *c; int *dev_a, *dev_b, ...

3 la respuesta

CUDA Llamadas externas no admitidas

Estoy desarrollando una aplicación CUDA 4.0 que se ejecuta en una tarjeta Fermi. De acuerdo con las especificaciones, Fermi tiene Compute Capability 2.0 y, por lo tanto, debe admitir llamadas de función no en línea. Compilo todas las clases ...

1 la respuesta

CUDA - memcpy2d - tono equivocado

Acabo de comenzar la programación de CUDA e intentaba ejecutar el código que se muestra a continuación. La idea es copiar una matriz bidimensional en el dispositivo, calcular la suma de todos los elementos y recuperar la suma después (sé que ...

2 la respuesta

CUDA transferencia de dispositivo a dispositivo costosa

He escrito un código para intentar intercambiar cuadrantes de una matriz 2D con fines FFT, que se almacena en una matriz plana. int leftover = W-dcW; T *temp; T *topHalf; cudaMalloc((void **)&temp, dcW * sizeof(T)); //swap every row, left and ...

2 la respuesta

¿Cómo puedo sumar dos matrices 2d (inclinadas) usando bucles anidados para?

Soy nuevo en Cuda. Quiero sumar dos conjuntos 2d en un tercer conjunto. Yo uso el siguiente código: cudaMallocPitch((void**)&device_a, &pitch, 2*sizeof(int),2); cudaMallocPitch((void**)&device_b, &pitch, ...