Resultados de la búsqueda a petición "cuda"

2 la respuesta

punteros de función de dispositivo

Necesito una versión del dispositivo del siguiente código de host: double (**func)(double x); double func1(double x) { return x+1.; } double func2(double x) { return x+2.; } double func3(double x) { return x+3.; } void test(void) { double x; ...

2 la respuesta

fast CUDA empuje operador de comparación personalizada

Estoy evaluando CUDA y actualmente estoy usando la biblioteca Thrust para ordenar números. Me gustaría crear mi propio comparador para empujar :: ordenar, ¡pero se ralentiza dramáticamente! Creé mi propiaMenomplementación de @ ...

4 la respuesta

a función @Entry utiliza demasiados datos compartidos (0x8020 bytes + sistema 0x10 bytes, 0x4000 máx.): Error CUDA

stoy usando Tesla C2050, que tiene una capacidad de cálculo 2.0 y ha compartido memoria48KB. Pero cuando trato de usar esta memoria compartida, lanvcc compilador me da el siguiente error Entry function '_Z4SAT3PhPdii' uses too much shared data ...

4 la respuesta

Error al usar CUDA y C ++ 11

Estoy usando CUDA 4.1 y GCC 4.5 ... (¡FINALMENTE! CUDA es compatible con GCC 4.5, pero todavía estoy esperando GCC 4.6). De todos modos, ¿es posible usar C ++ 11 con CUDA 4.1? Intenté pasar: --compiler-options "-std=c++0x"to nvcc y me arroja ...

4 la respuesta

operaciones en una matriz 2D en el kernel CUDA para matlab

supongo que tengo la siguiente serie C: int add(int* a, int* b, int n) { for(i=0; i<n; i++) { for(j=0; j<n; j++) { a[i][j]+=b[i][j]; } } return 0; } Creo que la mejor manera de paralelizarlo es darse cuenta de que es un problema 2D y usar ...

6 la respuesta

Cuda Variable de matriz de memoria compartida

Estoy tratando de declarar una variable para la multiplicación de matrices de la siguiente manera: __shared__ float As[BLOCK_SIZE][BLOCK_SIZE]; Estoy tratando de hacerlo para que el usuario pueda ingresar el tamaño de la matriz para calcular, ...

2 la respuesta

Multiplicación de matriz dinámica con CUDA

a idea de mi programa simple que he estado tratando de escribir es tomar la entrada del usuario para ver qué tan grande de una matriz se multiplic Estoy buscando tomar la entrada x por x, actualmente no estoy buscando multiplicar dos tamaños ...

4 la respuesta

¿Ofrece OpenCL de AMD algo similar a GPUDirect de CUDA?

NVIDIA ofrece GPUDirect [http://developer.nvidia.com/gpudirect] para reducir los gastos generales de transferencia de memoria. Me pregunto si hay un concepto similar para AMD / ATI. Específicamente 1) ¿Las GPU AMD evitan la segunda ...

6 la respuesta

Copiando una estructura que contiene punteros al dispositivo CUDA

Estoy trabajando en un proyecto donde necesito mi dispositivo CUDA para realizar cálculos en una estructura que contiene punteros. typedef struct StructA { int* arr; } StructA;Cuando asigno memoria para la estructura y luego la copio al ...

2 la respuesta

CUDA ejecución simultánea del núcleo con múltiples núcleos por secuencia

El uso de diferentes flujos para los núcleos CUDA hace posible la ejecución concurrente del núcleo. Por lo tanton núcleos enn streams teóricamente podrían ejecutarse simultáneamente si se ajustan al hardware, ¿verdad? Ahora estoy enfrentando ...