Resultados da pesquisa a pedido "openmp"

1 a resposta

Equivalente de empuxo do código MP aberto

O código que estou tentando paralelizar no mp aberto é um Monte Carlo que se resume a algo como isto: int seed = 0; std::mt19937 rng(seed); double result = 0.0; int N = 1000; #pragma omp parallel for for(i=0; x < N; i++) { result += rng() } ...

1 a resposta

memset em paralelo com threads vinculadas a cada núcleo físico

Eu tenho testado o código emEm um código paralelo do OpenMP, haveria algum benefício para o memset ser executado em ...

1 a resposta

Chamando uma sub-rotina interna na região do OpenMP

Eu tenho um módulo que contém uma sub-rotina que contém outra sub-rotina. A sub-rotina externa possui uma região OpenMP paralela na qual chamo de sub-rotina interna. O código compila e executa sem nenhum erro, mas os resultados não ...

1 a resposta

Redução de OpenMP com tipo de modelo

template <typename T, std::size_t N> static T sum(const std::array<T, N>& a) { T result; // type of result (T) is not determined when pre-process? #pragma omp parallel for reduction(+: result) for(int i = 0; i < static_cast<int>(N); i++) { result ...

1 a resposta

Dependência de tarefas no OpenMP 4

O código a seguir funciona com base na especificação do OpenMP 4.0: A saída einouttipos de dependência. A tarefa gerada será uma tarefa dependente de todas as tarefas irmãos geradas anteriormente que fazem referência a pelo menos um dos itens da ...

1 a resposta

Redução definida pelo usuário em vetores de tamanhos variados

Estou tentando definir minha própria redução para vetores do complexo <float>, seguindoesta resposta [https://stackoverflow.com/a/28234148/463827]para a perguntaReduzindo a matriz no ...

1 a resposta

Influência na sobrecarga de agendamento estático no OpenMP

Pensei em quais fatores influenciaria a sobrecarga de agendamento estático no OpenMP. Na minha opinião, é influenciado por: Desempenho da CPUimplementação específica da biblioteca de tempo de execução OpenMPo número de threadsMas estou perdendo ...

1 a resposta

Reduções em paralelo no tempo logarítmico

Dadon somas parciais é possível somar todos os somas parciais em etapas paralelas do log2. Por exemplo, suponha que haja oito threads com oito somas parciais:s0, s1, s2, s3, s4, s5, s6, s7. Isso pode ser reduzido emlog2(8) = 3 etapas seqüenciais ...

1 a resposta

Paralelização de uma soma de prefixo (Openmp)

Eu tenho dois vetores, a [n] e b [n], onde n é um número grande. a[0] = b[0]; for (i = 1; i < size; i++) { a[i] = a[i-1] + b[i]; }Com esse código, tentamos obter que a [i] contenha a soma de todos os números em b [] até b [i]. Eu preciso ...

1 a resposta

Existe um simples `paralelo para` em golang como o OpenMP?

Estou tentando otimizar um quebra-cabeça com processamento paralelo, para obter melhor desempenho. Idealmente, em C99 com OpenMP, eu deveria poder fazer isso com a ajuda de um#pragma omp parallel for antes de umfor loop em questão e, então, cabe ...