Resultados da pesquisa a pedido "thrust"

2 a resposta

Obtendo o CUDA Thrust para usar um fluxo CUDA de sua escolha

Observando os lançamentos do kernel dentro do código do CUDA Thrust, parece que eles sempre usam o fluxo padrão. Posso fazer o Thrust usar um fluxo de minha escolha? Estou faltando algo na API?

1 a resposta

Impulso Classificar por chave em tempo real ou por uma abordagem diferente?

Eu queria saber se é possível classificar por chaves usando a Thrust Library sem a necessidade de criar um vetor para armazenar as chaves (em tempo real). Por exemplo, tenho os seguintes dois vetores: Chaves e Valores: vectorKeys: 0, 1, 2, 0, 1, ...

1 a resposta

Classificação de pixels de opengl usando CUDA e Thrust

Renderizei uma cena com opengl (também posso renderizá-la em uma textura) Eu quero usar CUDA / Thrust para classificar esta imagem renderizada Como vincular a textura que eu criei: cudaGraphicsGLRegisterImage a ser usada via impulso? talvez ...

2 a resposta

Como copiar de forma assíncrona a memória do host para o dispositivo usando fluxos de empuxo e CUDA

Gostaria de copiar a memória do host para o dispositivo usando o empuxo, como em thrust::host_vector<float> h_vec(1 << 28); thrust::device_vector<float> d_vec(1 << 28); thrust::copy(h_vec.begin(), h_vec.end(), d_vec.begin());usando fluxos CUDA ...

1 a resposta

Equivalente de empuxo do código MP aberto

O código que estou tentando paralelizar no mp aberto é um Monte Carlo que se resume a algo como isto: int seed = 0; std::mt19937 rng(seed); double result = 0.0; int N = 1000; #pragma omp parallel for for(i=0; x < N; i++) { result += rng() } ...

2 a resposta

Erro de segmentação ao usar thrust :: sort em CUDA

Estou tentando classificar uma matriz de objetos de classe com base em seu tipo, passando uma função de comparação como o parâmetro para a classificação de empuxo. odefinição de classe: class TetraCutInfo { public: int tetraid; unsigned int ...

1 a resposta

thrust :: max_element slow na comparação cublasIsamax - Implementação mais eficiente?

Preciso de uma implementação rápida e eficiente para encontrar o índice do valor máximo em uma matriz no CUDA. Esta operação precisa ser realizada várias vezes. Eu originalmente usei cublasIsamax para isso, no entanto, infelizmente, ele retorna o ...

1 a resposta

Como implementar loops aninhados no impulso cuda

Atualmente, tenho que executar um loop aninhado da seguinte maneira: for(int i = 0; i < N; i++){ for(int j = i+1; j <= N; j++){ compute(...)//some calculation here } }Eu tentei deixar o primeiro loopCPU e faça o segundo loopGPU. Os resultados ...

1 a resposta

O código Thrust simples executa cerca da metade da velocidade do meu kernel cuda ingênuo. Estou usando o Thrust errado?

Eu sou muito novo no Cuda e no Thrust, mas minha impressão foi que o Thrust, quando usado bem, deveria oferecer um desempenho melhor do que os kernels do Cuda escritos de forma ingênua. Estou usando o Thrust de maneira abaixo do ideal? Abaixo ...

1 a resposta

Classificando vértices compactados com empuxo

Então, eu tenho uma matriz de dispositivos de estruturas PackedVertex: struct PackedVertex { glm::vec3 Vertex; glm::vec2 UV; glm::vec3 Normal; }Estou tentando classificá-los para que as duplicatas sejam agrupadas na matriz; Eu não me importo com ...