Resultados da pesquisa a pedido "openmp"
Baixo desempenho devido ao hyper-threading com OpenMP: como vincular threads a núcleos
Estou desenvolvendo um código de multiplicação de matriz densa. Quando eu perfil o código, ele às vezes recebe cerca de 75% dos picos de flops do meu sistema de quatro núcleos e outras vezes cerca de 36%. A eficiência não muda entre as execuções ...
Paralelizando um loop for usando openmp e substituindo push_back
Gostaria de paralelizar o seguinte trecho de código, mas sou novo no openmp e na criação de código paralelo. std::vector<DMatch> good_matches; for (int i = 0; i < descriptors_A.rows; i++) { if (matches_RM[i].distance < 3 * min_dist) ...
Código MPI Fortran: como compartilhar dados no nó via openMP?
Estou trabalhando em um código Fortan que já usa MPI. Agora, estou enfrentando uma situação em que um conjunto de dados cresce muito, mas é o mesmo para todos os processos, portanto, prefiro armazená-lo na memória apenas uma vez por nó e todos ...
Afinidade de threads com Windows, MSVC e OpenMP
Quero vincular os threads no meu código a cada núcleo físico. Com o GCC, fiz isso com sucesso usandosched_setaffinity então não preciso mais definirexport OMP_PROC_BIND=true. Eu quero fazer a mesma coisa no Windows com MSVC. Windows e Linux ...
Medindo a largura de banda da memória do produto escalar de duas matrizes
O produto escalar de duas matrizes for(int i=0; i<n; i++) { sum += x[i]*y[i]; }não reutiliza dados, portanto deve ser uma operação ligada à memória. Portanto, devo poder medir a largura de banda da memória do produto escalar. Usando o código ...
Equivalente de empuxo do código MP aberto
O código que estou tentando paralelizar no mp aberto é um Monte Carlo que se resume a algo como isto: int seed = 0; std::mt19937 rng(seed); double result = 0.0; int N = 1000; #pragma omp parallel for for(i=0; x < N; i++) { result += rng() } ...
memset em paralelo com threads vinculadas a cada núcleo físico
Eu tenho testado o código emEm um código paralelo do OpenMP, haveria algum benefício para o memset ser executado em ...
Chamando uma sub-rotina interna na região do OpenMP
Eu tenho um módulo que contém uma sub-rotina que contém outra sub-rotina. A sub-rotina externa possui uma região OpenMP paralela na qual chamo de sub-rotina interna. O código compila e executa sem nenhum erro, mas os resultados não ...
Configurando o “configure” para o openMP no R
Eu tenho um pacote R que é facilmente acelerado usando o OpenMP. Se o seu compilador suporta, então você obtém a vitória, se não, os pragmas são ignorados e você obtém um núcleo. Meu problema é como fazer com que o sistema de compilação de ...
OpenMP / __ gnu_parallel para um mapa não ordenado
Em algum momento do meu código, tenho que fazer operações em todos os elementos em um unordered_map. Para acelerar esse processo, quero usar o openMP, mas a abordagem ingênua não funciona: std::unordered_map<size_t, double> hastTable; #pragma ...