OpenMP резко замедляет цикл

Я пытаюсь ускорить это для цикла с распараллеливанием OpenMP. У меня сложилось впечатление, что это должно разделить работу на несколько потоков. Однако, возможно, накладные расходы слишком велики, чтобы ускорить процесс.

Я должен упомянуть, что этот цикл происходит много-много раз, и каждый экземпляр цикла должен быть распараллелен. Число итераций цикла, newNx, может быть как 3, так и 256. Однако, если я условно распараллелил его только для newNx> 100 (только самые большие петли), это все еще значительно замедляется.

Есть ли здесь что-нибудь, что могло бы сделать это медленнее, чем предполагалось? Я должен также упомянуть, что векторы A, v, b ОЧЕНЬ велики, но я считаю, что доступ к O (1).

    #pragma omp parallel for private(j,k),shared(A,v,b)
    for(i=1;i

Ответы на вопрос(1)

Ваш ответ на вопрос