Resultados da pesquisa a pedido "openmp"

1 a resposta

Baixo desempenho devido ao hyper-threading com OpenMP: como vincular threads a núcleos

Estou desenvolvendo um código de multiplicação de matriz densa. Quando eu perfil o código, ele às vezes recebe cerca de 75% dos picos de flops do meu sistema de quatro núcleos e outras vezes cerca de 36%. A eficiência não muda entre as execuções ...

3 a resposta

Paralelizando um loop for usando openmp e substituindo push_back

Gostaria de paralelizar o seguinte trecho de código, mas sou novo no openmp e na criação de código paralelo. std::vector<DMatch> good_matches; for (int i = 0; i < descriptors_A.rows; i++) { if (matches_RM[i].distance < 3 * min_dist) ...

3 a resposta

Código MPI Fortran: como compartilhar dados no nó via openMP?

Estou trabalhando em um código Fortan que já usa MPI. Agora, estou enfrentando uma situação em que um conjunto de dados cresce muito, mas é o mesmo para todos os processos, portanto, prefiro armazená-lo na memória apenas uma vez por nó e todos ...

1 a resposta

Afinidade de threads com Windows, MSVC e OpenMP

Quero vincular os threads no meu código a cada núcleo físico. Com o GCC, fiz isso com sucesso usandosched_setaffinity então não preciso mais definirexport OMP_PROC_BIND=true. Eu quero fazer a mesma coisa no Windows com MSVC. Windows e Linux ...

2 a resposta

Medindo a largura de banda da memória do produto escalar de duas matrizes

O produto escalar de duas matrizes for(int i=0; i<n; i++) { sum += x[i]*y[i]; }não reutiliza dados, portanto deve ser uma operação ligada à memória. Portanto, devo poder medir a largura de banda da memória do produto escalar. Usando o código ...

1 a resposta

Equivalente de empuxo do código MP aberto

O código que estou tentando paralelizar no mp aberto é um Monte Carlo que se resume a algo como isto: int seed = 0; std::mt19937 rng(seed); double result = 0.0; int N = 1000; #pragma omp parallel for for(i=0; x < N; i++) { result += rng() } ...

1 a resposta

memset em paralelo com threads vinculadas a cada núcleo físico

Eu tenho testado o código emEm um código paralelo do OpenMP, haveria algum benefício para o memset ser executado em ...

1 a resposta

Chamando uma sub-rotina interna na região do OpenMP

Eu tenho um módulo que contém uma sub-rotina que contém outra sub-rotina. A sub-rotina externa possui uma região OpenMP paralela na qual chamo de sub-rotina interna. O código compila e executa sem nenhum erro, mas os resultados não ...

2 a resposta

Configurando o “configure” para o openMP no R

Eu tenho um pacote R que é facilmente acelerado usando o OpenMP. Se o seu compilador suporta, então você obtém a vitória, se não, os pragmas são ignorados e você obtém um núcleo. Meu problema é como fazer com que o sistema de compilação de ...

2 a resposta

OpenMP / __ gnu_parallel para um mapa não ordenado

Em algum momento do meu código, tenho que fazer operações em todos os elementos em um unordered_map. Para acelerar esse processo, quero usar o openMP, mas a abordagem ingênua não funciona: std::unordered_map<size_t, double> hastTable; #pragma ...