Reconhecimento da operação de gravação de dados do Hadoop 2.0
Eu tenho uma pequena consulta sobre gravações de dados hadoop
Da documentação do Apache
No caso comum, quando o fator de replicação é três, a política de posicionamento do HDFS é colocar uma réplica em um nó no rack local, outra em um nó em um rack (remoto) diferente e a última em um nó diferente no mesmo rack remoto. Essa política reduz o tráfego de gravação entre rack, o que geralmente melhora o desempenho da gravação. A chance de falha no rack é muito menor do que a falha no nó;
Na imagem abaixo, quando a confirmação de gravação é tratada como bem-sucedida?
1) Gravando dados no primeiro nó de dados?
2) Gravando dados no primeiro nó de dados + 2 outros nós de dados?
Estou fazendo essa pergunta porque, ouvi duas declarações conflitantes nos vídeos do youtube. Um vídeo citado que a gravação é bem-sucedida quando os dados são gravados em um nó de dados e outro vídeo citado que o reconhecimento será enviado somente após a gravação dos dados nos três nós.