Apache Drill плохая производительность

Question

Sep 20, 2016, 12:27 AM

Apache Drill плохая производительность

Я попытался использовать Apache-Drill для выполнения простого запроса объединения-объединения, и скорость была не очень хорошей. мой тестовый запрос был:

SELECT p.Product_Category, SUM(f.sales)
FROM facts f
JOIN Product p on f.pkey = p.pkey
GROUP BY p.Product_Category

Где факты имеют около 422 000 строк, а продукт имеет 600 строк. группировка возвращается с 4 рядами.

Сначала я проверил этот запрос на SqlServer и получил результат примерно через 150 мс.

Сначала я попытался подключиться напрямую к SqlServer и выполнить запрос, но это было медленно (около 5 секунд).

Затем я попытался сохранить таблицы в файлы json и прочитать из них, но это было еще медленнее, поэтому я попробовал паркетные файлы.

Я получил результат обратно в первом запуске примерно через 3 секунды. следующий пробег был около 900 мс, а затем он стабилизировался на отметке 500 мс.

Из прочтения это не имеет смысла, и тренировка должна быть быстрее! Я попробовал "ОБНОВИТЬ СТОЛОВЫЕ МЕТАДАТЫ", но скорость не изменилась.

Я запускал это на окнах через командную строку сверла.

Любая идея, если мне нужна дополнительная конфигурация или что-то?

Спасибо!

Apache Drill плохая производительность

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Apache Drill плохая производительность

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы