Cómo usar MPI_Reduce para sumar diferentes valores de diferentes grupos de procesadores de forma independiente

Estoy tratando de dividir mis procesadores en grupos y luego agregar la suma de cada grupo de forma independiente ... pero no pude encontrar el resultado correctamente hasta ahora. Un ejemplo simple es el siguiente:

int main(int argc, char** argv) 
{
    int size, rank,i=0,localsum1=0,globalsum1=0,localsum2=0,globalsum2=0;

    MPI_Init(&argc,&argv);
    MPI_Comm_size(MPI_COMM_WORLD,&size);
    MPI_Comm_rank(MPI_COMM_WORLD,&rank);

    if(rank==0)
    {
    }
    else if(rank==1)
    {
        localsum1 += 5;
        MPI_Reduce(&localsum1,&globalsum1,2,MPI_INT,MPI_SUM,0,MPI_COMM_WORLD);
    }
    else if(rank==2)
    {
        localsum2 += 10;
        MPI_Reduce(&localsum2,&globalsum2,2,MPI_INT,MPI_SUM,0,MPI_COMM_WORLD);
    }

    if(rank==0)
    {
        printf("globalsum1 = %d \n",globalsum1);
        printf("globalsum2 = %d \n",globalsum2);
    }
    MPI_Finalize();

    return (EXIT_SUCCESS);
}

No puedo averiguar qué es lo que falta aquí ... ¿alguien puede ayudar?

Respuestas a la pregunta(1)

Su respuesta a la pregunta