Resultados da pesquisa a pedido "cuda"

1 a resposta

thrust :: device_vector em CUDA [duplicado]

Esta pergunta já tem uma resposta aqui: Thrust dentro do usuário escrito kernels [/questions/5510715/thrust-inside-user-written-kernels] 4 respostas Sou novo na CUDA e está tentando aprender o uso. Alguém pode ajudar por favor. Eu tenho ...

2 a resposta

ator de escala para CUFFT

Eu escrevi um programa de teste simples, onde eu estava fazendo Complex to Complex FT e acabei de gerar alguns dados 1..50 e colei na parte real e imaginária de cada índice da matri Quando faço uma operação como esta IFFT (FFT (A)) = A ara ...

2 a resposta

Os threads em um warp CUDA são executados em paralelo em um multiprocessado

Um warp tem 32 threads. Os 32 threads são executados em paralelo em um multiprocessador? Se 32 threads não estiverem sendo executados em paralelo, não haverá condição de corrida no warp. Eu tenho essa dúvida depois de analisar alguns exemplo

5 a resposta

Ordenar objetos com Thrust CUDA

É possível classificar objetos usando a biblioteca Thrust? Eu tenho a seguinte estrutura: struct OB{ int N; Cls *C; //CLS is another struct. } É possível usar o empuxo para classificar uma matriz de OB de acordo com N? Você pode fornecer um ...

4 a resposta

O que é um bom algoritmo de classificação na CUDA?

Eu tenho uma matriz de struct e preciso classificá-la de acordo com uma propriedade da estrutura (N). O objeto fica assim: struct OBJ { int N; //sort array of OBJ with respect to N OB *c; //OB is another struct } O tamanho da matriz é pequeno, ...

2 a resposta

CUDA: Usando realloc dentro do kernel

Sei que é possível usarmalloc dentro do kernel para alocar memória na memória global da GPU. Também é possível usarrealloc?

1 a resposta

diferença de conjunto @thrust falha ao compilar com a chamada de uma função __host__ de uma função __host__ __device__ não é permitida

Tenho dois conjuntos A e B de 20 e 10 números inteiros, respectivamente. B é um subconjunto de A. Preciso encontrar o conjunto complementar de B. Uso thrust :: set_difference para encontrar a diferença de conjunto. No entanto, ele falha ...

1 a resposta

Como usar o recurso de grupos cooperativos do CUDA no Windows

@My GPU é GeForce MX150, arquitetura pascal, CC. 6.1, CUDA 9.1, windows 10. Embora minha GPU seja pascal, mas grupos cooperativos não funcionam. Quero usá-lo para sincronização entre blocos. Descobri que meu modo tcc não está ativ ambém descobri ...

2 a resposta

CUBLAS - adição de matriz .. com

Estou tentando usar CUBLAS para somar duas grandes matrizes de tamanho desconhecido. Eu preciso de um código totalmente otimizado (se possível), portanto optei por não reescrever o código de adição da matriz (simples), mas usando CUBLAS, em ...

4 a resposta

Thrust dentro do usuário escrito kernels

Eu sou um novato na Thrust. Vejo que todas as apresentações e exemplos do Thrust mostram apenas o código do host. Gostaria de saber se posso passar um device_vector para o meu próprio kernel? Quão? Se sim, quais são as operações permitidas ...