Resultados da pesquisa a pedido "cuda"

Esta pergunta já tem uma resposta aqui: Thrust dentro do usuário escrito kernels [/questions/5510715/thrust-inside-user-written-kernels] 4 respostas Sou novo na CUDA e está tentando aprender o uso. Alguém pode ajudar por favor. Eu tenho ...

c++fft fftw

2 a resposta

ator de escala para CUFFT

Eu escrevi um programa de teste simples, onde eu estava fazendo Complex to Complex FT e acabei de gerar alguns dados 1..50 e colei na parte real e imaginária de cada índice da matri Quando faço uma operação como esta IFFT (FFT (A)) = A ara ...

gpu-warp gpgpu

2 a resposta

Os threads em um warp CUDA são executados em paralelo em um multiprocessado

Um warp tem 32 threads. Os 32 threads são executados em paralelo em um multiprocessador? Se 32 threads não estiverem sendo executados em paralelo, não haverá condição de corrida no warp. Eu tenho essa dúvida depois de analisar alguns exemplo

sorting thrust cudpp

5 a resposta

Ordenar objetos com Thrust CUDA

É possível classificar objetos usando a biblioteca Thrust? Eu tenho a seguinte estrutura: struct OB{ int N; Cls *C; //CLS is another struct. } É possível usar o empuxo para classificar uma matriz de OB de acordo com N? Você pode fornecer um ...

sorting

4 a resposta

O que é um bom algoritmo de classificação na CUDA?

Eu tenho uma matriz de struct e preciso classificá-la de acordo com uma propriedade da estrutura (N). O objeto fica assim: struct OBJ { int N; //sort array of OBJ with respect to N OB *c; //OB is another struct } O tamanho da matriz é pequeno, ...

2 a resposta

CUDA: Usando realloc dentro do kernel

Sei que é possível usarmalloc dentro do kernel para alocar memória na memória global da GPU. Também é possível usarrealloc?

compiler-errors thrust set

1 a resposta

diferença de conjunto @thrust falha ao compilar com a chamada de uma função host de uma função host device não é permitida

Tenho dois conjuntos A e B de 20 e 10 números inteiros, respectivamente. B é um subconjunto de A. Preciso encontrar o conjunto complementar de B. Uso thrust :: set_difference para encontrar a diferença de conjunto. No entanto, ele falha ...

parallel-processing gpu-programming nvidia gpu-cooperative-groups

1 a resposta

Como usar o recurso de grupos cooperativos do CUDA no Windows

@My GPU é GeForce MX150, arquitetura pascal, CC. 6.1, CUDA 9.1, windows 10. Embora minha GPU seja pascal, mas grupos cooperativos não funcionam. Quero usá-lo para sincronização entre blocos. Descobri que meu modo tcc não está ativ ambém descobri ...

c++blas matrix cublas

2 a resposta

CUBLAS - adição de matriz .. com

Estou tentando usar CUBLAS para somar duas grandes matrizes de tamanho desconhecido. Eu preciso de um código totalmente otimizado (se possível), portanto optei por não reescrever o código de adição da matriz (simples), mas usando CUBLAS, em ...

thrust

4 a resposta

Thrust dentro do usuário escrito kernels

Eu sou um novato na Thrust. Vejo que todas as apresentações e exemplos do Thrust mostram apenas o código do host. Gostaria de saber se posso passar um device_vector para o meu próprio kernel? Quão? Se sim, quais são as operações permitidas ...

Página 48 do 59

46 474849 50

Resultados da pesquisa a pedido "cuda"

thrust :: device_vector em CUDA [duplicado]

ator de escala para CUFFT

Os threads em um warp CUDA são executados em paralelo em um multiprocessado

Tags populares

Ordenar objetos com Thrust CUDA

O que é um bom algoritmo de classificação na CUDA?

CUDA: Usando realloc dentro do kernel

diferença de conjunto @thrust falha ao compilar com a chamada de uma função host de uma função host device não é permitida

Como usar o recurso de grupos cooperativos do CUDA no Windows

CUBLAS - adição de matriz .. com

Thrust dentro do usuário escrito kernels

Você é muito ativo! É ótimo!

Resultados da pesquisa a pedido "cuda"

Tags populares