Resultados de la búsqueda a petición "cuda"

1 la respuesta

CUDA C ++: esperaba una expresión en el archivo kernel.cu

Acabo de comenzar a aprender un poco de CUDA, y encontré este error en la siguiente línea, en una expresión <<< >>> #include "kernels.h" #include "helpers.h" #include <iostream> #include <cmath> #include <cuda_runtime.h> #include ...

4 la respuesta

Error de CUDA 9 no compatible con VS 2017

Recientemente actualicé mi VS 2017 y ahora ni siquiera puedo construir un proyecto CUDA predeterminado (el que tiene la adición del vector). Sospecho que esto se debe al siguiente error: Severity Code Description Project File Line Suppression ...

1 la respuesta

Cantidad de memoria local por hilo CUDA

Leí en la documentación de NVIDIA ( http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#features-and-technical-specifications [http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#features-and-technical-specifications] , ...

1 la respuesta

CUDA: ¿Cómo llenar un vector de tamaño dinámico en el dispositivo y devolver su contenido a otra función del dispositivo?

Quiero saber cuál es la técnica adecuada para llenar una matriz de tamaño dinámico en el dispositivo (int * fila, en el código debajo) y luego devolver su contenido, para ser utilizado por otra función del dispositivo. Con el objetivo de ...

1 la respuesta

CUDA falla al intentar utilizar tanto iGPU a bordo como tarjeta discreta Nvidia. ¿Cómo puedo usar nvidia discreta e intel gpu integrada (integrada)? [cerrado]

Recientemente tuve algunos problemas para hacer que mi PC (ivybridge) use el gpu integrado (intel igpu HD4000) para el uso normal de la pantalla, mientras ejecuto miCUDAprogramas para cálculos en la discreta Nvidia GT 640 que tengo en mi ...

1 la respuesta

Cómo implementar bucles anidados en el empuje de Cuda

Actualmente tengo que ejecutar un bucle anidado de la siguiente manera: for(int i = 0; i < N; i++){ for(int j = i+1; j <= N; j++){ compute(...)//some calculation here } }He intentado dejar el primer bucle enCPU y hacer el segundo bucle enGPU. ...

3 la respuesta

¿Cómo funciona CudaMalloc?

Estoy tratando de modificar la clase imageDenosing en CUDA SDK, necesito repetir el filtro muchas veces para capturar el tiempo. Pero mi código no funciona correctamente. //comienzo __global__ void F1D(TColor *image,int imageW,int imageH, ...

1 la respuesta

El código de empuje simple funciona aproximadamente la mitad de rápido que mi ingenuo núcleo de Cuda. ¿Estoy usando Thrust mal?

Soy bastante nuevo en Cuda y Thrust, pero mi impresión fue que Thrust, cuando se usa bien, se supone que ofrece un mejor rendimiento que los núcleos de Cuda escritos ingenuamente. ¿Estoy usando Thrust de una manera subóptima? A continuación se ...

1 la respuesta

Clasificación de vértices empaquetados con empuje

Entonces tengo una matriz de dispositivos de estructuras PackedVertex: struct PackedVertex { glm::vec3 Vertex; glm::vec2 UV; glm::vec3 Normal; }Estoy tratando de ordenarlos para que los duplicados se agrupen en la matriz; No me importa el orden ...

1 la respuesta

¿Cómo pasar una matriz de vectores al núcleo de Cuda?

Ahora tengo thrust::device_vector<int> A[N];y mi función kernel __global__ void kernel(...) { auto a = A[threadIdx.x]; }Sé que a través de thrust :: raw_pointer_cast podría pasar un device_vector al kernel. Pero, ¿cómo podría pasarle una matriz ...