@ OmarAli Конечно, это работает. Внешний или управляемый, не имеет значения. Единственная разница между внешним и управляемым - это поведение таблицы DROP. Управляемая таблица DROP также удалит данные. При удалении внешней таблицы удаляется только определение таблицы. Также вы можете создать несколько разных таблиц поверх одного и того же каталога в HDFS одновременно.

ьшинстве вопросов / ответов по SO и в Интернете обсуждается использование Hive для объединения нескольких небольших файлов ORC в более крупный, однако мои файлы ORC - это файлы журнала, которые разделены по дням, и мне нужно хранить их отдельно. Я только хочу "свернуть" файлы ORC в день (которые являются каталогами в HDFS).

Мне нужно написать решение на Java скорее всего и наткнулсяOrcFileMergeOperator что может быть то, что мне нужно использовать, но пока рано говорить.

Каков наилучший подход к решению этой проблемы?

Ответы на вопрос(2)

Ваш ответ на вопрос