Проблема с производительностью в версии куста 0.13.1

я используюAWS-ЭЙ чтобы выполнить мои запросы Hive, и у меня возникла проблема с производительностью при запуске куста версии 0.13.1.

Новая версия куста заняла около 5 минут для обработки 10 строк данных. Но тот же сценарий для 230804 строк занимает 2 дня и все еще выполняется. Что я должен сделать, чтобы проанализировать и устранить проблему?

Пример данных:

Таблица 1:

hive> describe foo;
OK
orderno    string
Time taken: 0.101 seconds, Fetched: 1 row(s)

Пример данных для таблицы 1:

hive>select * from foo;        
OK
1826203307
1826207803
1826179498
1826179657

Таблица 2:

hive> describe de_geo_ip_logs;
OK
id          bigint                                      
startorderno        bigint                                      
endorderno          bigint                                      
itemcode                int                                         
Time taken: 0.047 seconds, Fetched: 4 row(s)

Пример данных для Таблицы 2:

hive> select * from bar;

127698025   417880320   417880575   306
127698025   3038626048  3038626303  584
127698025   3038626304  3038626431  269
127698025   3038626560  3038626815  163

Мой запрос:

SELECT b.itemcode
FROM foo a,  bar b
WHERE a.orderno BETWEEN b.startorderno AND b.endorderno;

Ответы на вопрос(1)

Ваш ответ на вопрос