Como o impala fornece uma resposta de consulta mais rápida em comparação com a colmeia

Recentemente, comecei a investigar grandes conjuntos de dados CSV localizados no HDFS usando o Hive e o Impala. Como eu estava esperando, obtive melhor tempo de resposta com o Impala em comparação com o Hive para as consultas que usei até agora.

Eu estou querendo saber se existem alguns tipos de consultas / casos de uso que ainda precisam do Hive e onde o Impala não é um bom ajuste.

Como o Impala fornece uma resposta de consulta mais rápida em comparação com o Hive para os mesmos dados no HDFS?

questionAnswers(3)

yourAnswerToTheQuestion