Resultados de la búsqueda a petición "cuda"
__forceinline__ efecto en CUDA C __device__ funciones
Hay muchos consejos sobre cuándo usar las funciones en línea y cuándo evitarlo en la codificación C regular. ¿Cuál es el efecto de
cudaMemset () - ¿establece bytes o enteros?
Desdeen línea documentación:
Copiando una estructura que contiene punteros al dispositivo CUDA
Estoy trabajando en un proyecto donde necesito mi dispositivo CUDA para realizar cálculos en una estructura que contiene punteros. typedef struct StructA { int* arr; } StructA;Cuando asigno memoria para la estructura y luego la copio al ...
Pasando un objeto de clase a un kernel
¿Podemos pasar un objeto a una función del kernel?Considera que tengo una clase
Cómo usar GPUDirect RDMA con Infiniband
Tengo dos maquinas. Hay varias tarjetas Tesla en cada máquina. También hay una tarjeta InfiniBand en cada máquina. Quiero comunicarme entre tarjetas GPU en diferentes máquinas a través de InfiniBand. Solo punto a punto, la unidifusión estaría ...
Por qué cudaGLSetGLDevice falló, aunque se llame en la primera línea de la función principal
Quiero usar la interoperabilidad entre OpenGL y CUDA. Sé, como dijeron algunos tutoriales, el primer paso es elegir el dispositivo. Sin embargo, cuando llamé...
No es la misma imagen después de cuda FFT e iFFT
Estoy tratando de preformar un FFT -> filtrado de rampa -> iFFT en una imagen 2D con CUDA. Primero, como prueba, intenté hacer FFT e iFFt sin ningún filtro. Después de la FFT y la iFFT, la imagen parece la misma, pero antes de la operación los ...
Evaluación de expresiones que consisten en operaciones matriciales de elementos en Thrust
Me gustaría usar Thrust para evaluar expresiones que consistan en operaciones matriciales de elementos. Para que quede claro, consideremos una expresión como:
Pasar la función de host como un puntero de función en __global__ OR __device__ function en CUDA
Actualmente estoy desarrollando una versión de GPU de una función de CPU (por ejemplo, la función Calc (int a, int b, double * c, souble * d, CalcInvFunction GetInv)), en la que una función de host se pasa como un puntero de función (por ejemplo, ...
Cómo copiar asincrónicamente la memoria del host al dispositivo utilizando flujos de empuje y CUDA
Me gustaría copiar la memoria del host al dispositivo usando empuje como en thrust::host_vector<float> h_vec(1 << 28); thrust::device_vector<float> d_vec(1 << 28); thrust::copy(h_vec.begin(), h_vec.end(), d_vec.begin());usando transmisiones de ...