ntendendo a saída do terminal Spark durante os estágios [duplicado]
Esta pergunta já tem uma resposta aqui:
O que significam os números na barra de progresso no shell de faísca? 2 respostasSou novo no Spark e estou tentando entender a saída de log de seus estágios no meu terminal. Estou trabalhando com um conjunto de dados muito grande na minha máquina local e, durante as ações, verei algo como:
[Stage: 4 ==> (10 + 4) / 200]
Entendo que estágios são todas as operações que acontecem com o RDD, mas e os números no final? Eles representam tarefas?
(10 + 4) / 200]
10
o número de tarefas concluídas?4
o número de tarefas simultâneas em execução (ou seja, o número de núcleos na minha máquina?)200
o número total de tarefas para esta etapa?