Como o impala fornece uma resposta de consulta mais rápida em comparação com a colmeia
Recentemente, comecei a investigar grandes conjuntos de dados CSV localizados no HDFS usando o Hive e o Impala. Como eu estava esperando, obtive melhor tempo de resposta com o Impala em comparação com o Hive para as consultas que usei até agora.
Eu estou querendo saber se existem alguns tipos de consultas / casos de uso que ainda precisam do Hive e onde o Impala não é um bom ajuste.
Como o Impala fornece uma resposta de consulta mais rápida em comparação com o Hive para os mesmos dados no HDFS?