Hadoop ORC файл - Как это работает - Как получить метаданные

Я новичок в файле ORC. Я просмотрел много блогов, но не получил четкого понимания. Пожалуйста, помогите и уточните ниже вопросы.

Могу ли я получить схему из файла ORC? Я знаю в Авро, схему можно получить.

Как это на самом деле обеспечивает эволюцию схемы? Я знаю, что можно добавить несколько столбцов. Но как это сделать. Единственное, что я знаю, это создание файла orc путем загрузки данных в таблицу кустов, в которой хранятся данные в формате orc.

Как работает индекс файлов ORC? То, что я знаю, для каждого индекса полосы будет поддерживаться. Но так как файл не отсортирован, он помогает искать данные в списке полос. Как это помогает в пропуске полос при поиске данных?

Индекс поддерживается для каждого столбца. Если да, то не будет ли он потреблять больше памяти?

Как колоночный формат ORC-файла может вписаться в таблицу кустов, где значения каждого столбца хранятся вместе. в то время как таблица улья сделана для извлечения записи по записи. Как оба будут соответствовать друг другу?

Ответы на вопрос(2)

Ваш ответ на вопрос