cout processador mais lento MPI

Estou escrevendo um programa usando MPI. Cada processador executa um loop for:

int main(int argc, char** argv) {
  boost::mpi::environment env(argc, argv);

  for( int i=0; i<10; ++i ) {
    std::cout << "Index " << i << std::endl << std::flush;
  }
}

Existe uma maneira de fazer o cout acontecer apenas no último processador para atingir o índice i? Ou sinaliza para que uma linha seja executada apenas no último processador para chegar a ela?

questionAnswers(1)

yourAnswerToTheQuestion