Как Impala обеспечивает более быстрый ответ на запрос по сравнению с ульем
Недавно я начал изучать большие наборы данных CSV, лежащих в HDFS, используя Hive и Impala. Как я и ожидал, я получаю лучшее время отклика с Impala по сравнению с Hive для запросов, которые я использовал до сих пор.
Мне интересно, есть ли какие-то типы запросов / вариантов использования, которые все еще нуждаются в Hive, и где Impala не подходит.
Как Impala обеспечивает более быстрый ответ на запрос по сравнению с Hive для тех же данных в HDFS?