Resultados de la búsqueda a petición "cuda"

2 la respuesta

Calculando el rendimiento de CUFFT

Estoy ejecutando CUFFT en fragmentos (N * N / p) divididos en múltiples GPU, y tengo una pregunta sobre el cálculo del rendimiento. Primero, un poco sobre cómo lo estoy haciendo: Envíe fragmentos N * N / p a cada GPUFFT 1-D por lotes para cada ...

4 la respuesta

Penalización de rendimiento al invocar un núcleo de Cuda

Me pregunto cuál es la sobrecarga de realizar una llamada de kernel cuda en C / C ++ como la siguiente: somekernel1<<<blocks,threads>>>(args); somekernel2<<<blocks,threads>>>(args); somekernel3<<<blocks,threads>>>(args); La razón por la que ...

8 la respuesta

Error de argumento inválido al copiar datos del dispositivo al host

Tengo problemas para copiar los datos de mi dispositivo de nuevo al host. Mis datos están organizados en una estructura: typedef struct Array2D { double* arr; int rows; int cols; } Array2D;arr es una matriz 'plana'. @rows ycols describe las ...

2 la respuesta

¿Cómo usar el compilador Intel C ++ con CUDA nvcc?

Estoy usando NVIDIA CUDA 4.1 en Microsoft Visual Studio 2008. También tengo instalado Intel Parallel Studio XE 2011. Por defecto, el compilador C de NVIDIAnvcc.exe utiliza el compilador de C de Microsoftcl.exe para compilar su código C. ¿Cómo ...

2 la respuesta

¿El conjunto completo más pequeño posible de archivos fuente y por lotes para construir una aplicación CUDA a través de la línea de comandos?

Asumir Windows 7 OSVisual Studio Express 2010 SP1 recién instalado (y no modificado con ninguna*.rules o lo que seaCUDA SDK instaladoGPU computing SDK instalado conjunto de variables de entorno limpio / vacío (entonces, necesitamos ...

2 la respuesta

Trouble trabajando con CUSPARSE

Como quería compilar mi programa (usando Cusparse) aparecieron las siguientes líneas: tmp / tmpxft_00001048_00000000-13_matvec.o: en funciónmain': tmpxft_00001048_00000000-1_matvec.cudafe1.cpp:(.text+0x6d5): undefined reference to ...

24 la respuesta

¿Cómo obtener la versión cuda?

¿Hay algún comando o script rápido para verificar la versión de CUDA instalada? Encontré el manual de 4.0 en el directorio de instalación, pero no estoy seguro de si es de la versión instalada real o no.

10 la respuesta

Explicación de CUDA C y C ++

¿Alguien puede darme una buena explicación sobre la naturaleza de CUDA C y C ++? Según tengo entendido, se supone que CUDA es C con las bibliotecas de GPU de NVIDIA. A partir de ahora, CUDA C admite algunas características de C ++ pero ...

2 la respuesta

¿Se pueden usar los tipos de datos de cadena en los núcleos C ++ CUDA?

Estoy escribiendo un núcleo CUDA en el que estoy usando lastring tipo de datos en C ++. Sin embargo, el compilador arroja el siguiente error: error: calling a host function("std::basic_string<char, std::char_traits<char>, std::allocator<char> ...

6 la respuesta

CUDA: ¿Por qué los operadores bit a veces son más rápidos que los operadores lógicos?

Cuando estoy a punto de exprimir el último bit de rendimiento de un kernel, generalmente encuentro que reemplazar eloperadores logico (&& y||) conbitwise operadores (& y|) hace que el núcleo sea un poco más rápido. Esto se observó mirando el ...