Avro vs. Parquet
Estou planejando usar um dos formatos de arquivo hadoop para o meu projeto relacionado ao hadoop. EuCompreendo parquet é eficiente para consultas baseadas em colunas e avro para varredura completa ou quando precisamos de todos os dados das colunas!
Antes de prosseguir e escolher um dos formatos de arquivo, quero entender quais são as desvantagens / desvantagens de um sobre o outro. Alguém pode me explicar em termos simples?