Resultados da pesquisa a pedido "cuda"
thrust :: device_vector em CUDA [duplicado]
Esta pergunta já tem uma resposta aqui: Thrust dentro do usuário escrito kernels [/questions/5510715/thrust-inside-user-written-kernels] 4 respostas Sou novo na CUDA e está tentando aprender o uso. Alguém pode ajudar por favor. Eu tenho ...
ator de escala para CUFFT
Eu escrevi um programa de teste simples, onde eu estava fazendo Complex to Complex FT e acabei de gerar alguns dados 1..50 e colei na parte real e imaginária de cada índice da matri Quando faço uma operação como esta IFFT (FFT (A)) = A ara ...
Os threads em um warp CUDA são executados em paralelo em um multiprocessado
Um warp tem 32 threads. Os 32 threads são executados em paralelo em um multiprocessador? Se 32 threads não estiverem sendo executados em paralelo, não haverá condição de corrida no warp. Eu tenho essa dúvida depois de analisar alguns exemplo
Ordenar objetos com Thrust CUDA
É possível classificar objetos usando a biblioteca Thrust? Eu tenho a seguinte estrutura: struct OB{ int N; Cls *C; //CLS is another struct. } É possível usar o empuxo para classificar uma matriz de OB de acordo com N? Você pode fornecer um ...
O que é um bom algoritmo de classificação na CUDA?
Eu tenho uma matriz de struct e preciso classificá-la de acordo com uma propriedade da estrutura (N). O objeto fica assim: struct OBJ { int N; //sort array of OBJ with respect to N OB *c; //OB is another struct } O tamanho da matriz é pequeno, ...
CUDA: Usando realloc dentro do kernel
Sei que é possível usarmalloc dentro do kernel para alocar memória na memória global da GPU. Também é possível usarrealloc?
diferença de conjunto @thrust falha ao compilar com a chamada de uma função __host__ de uma função __host__ __device__ não é permitida
Tenho dois conjuntos A e B de 20 e 10 números inteiros, respectivamente. B é um subconjunto de A. Preciso encontrar o conjunto complementar de B. Uso thrust :: set_difference para encontrar a diferença de conjunto. No entanto, ele falha ...
Como usar o recurso de grupos cooperativos do CUDA no Windows
@My GPU é GeForce MX150, arquitetura pascal, CC. 6.1, CUDA 9.1, windows 10. Embora minha GPU seja pascal, mas grupos cooperativos não funcionam. Quero usá-lo para sincronização entre blocos. Descobri que meu modo tcc não está ativ ambém descobri ...
CUBLAS - adição de matriz .. com
Estou tentando usar CUBLAS para somar duas grandes matrizes de tamanho desconhecido. Eu preciso de um código totalmente otimizado (se possível), portanto optei por não reescrever o código de adição da matriz (simples), mas usando CUBLAS, em ...
Thrust dentro do usuário escrito kernels
Eu sou um novato na Thrust. Vejo que todas as apresentações e exemplos do Thrust mostram apenas o código do host. Gostaria de saber se posso passar um device_vector para o meu próprio kernel? Quão? Se sim, quais são as operações permitidas ...