Apache Drill плохая производительность

Я попытался использовать Apache-Drill для выполнения простого запроса объединения-объединения, и скорость была не очень хорошей. мой тестовый запрос был:

SELECT p.Product_Category, SUM(f.sales)
FROM facts f
JOIN Product p on f.pkey = p.pkey
GROUP BY p.Product_Category

Где факты имеют около 422 000 строк, а продукт имеет 600 строк. группировка возвращается с 4 рядами.

Сначала я проверил этот запрос на SqlServer и получил результат примерно через 150 мс.

Сначала я попытался подключиться напрямую к SqlServer и выполнить запрос, но это было медленно (около 5 секунд).

Затем я попытался сохранить таблицы в файлы json и прочитать из них, но это было еще медленнее, поэтому я попробовал паркетные файлы.

Я получил результат обратно в первом запуске примерно через 3 секунды. следующий пробег был около 900 мс, а затем он стабилизировался на отметке 500 мс.

Из прочтения это не имеет смысла, и тренировка должна быть быстрее! Я попробовал "ОБНОВИТЬ СТОЛОВЫЕ МЕТАДАТЫ", но скорость не изменилась.

Я запускал это на окнах через командную строку сверла.

Любая идея, если мне нужна дополнительная конфигурация или что-то?

Спасибо!

Ответы на вопрос(2)

Ваш ответ на вопрос