Что значит иметь несколько столбцов сортировки?
Redshift позволяет обозначить несколько столбцов какSORTKEY
столбцы, но большая часть документации по передовому опыту написана так, как если бы был только один SORTKEY.
Если я создаю таблицу сSORTKEY (COL1, COL2)
Означает ли это, что все столбцы хранятся отсортированы по COL1, а затем COL2? Или, может быть, поскольку это хранилище столбцов, каждый столбец хранится в другом порядке? То есть COL1 в порядке COL1, COL2 в порядке COL2, а остальные столбцы неупорядочены?
Моя ситуация такова, что у меня есть таблица с (среди прочего) type_id и столбцом метки времени. Данные поступают примерно в порядке отметки времени. Большинство запросов объединяются против / ограничены как type_id, так и timestamp. Обычно предложения type_id являются более конкретными, то есть гораздо больший процент строк может быть исключен при рассмотрении предложения type_id, чем при рассмотрении предложения timestamp. type_id является DISTKEY по этой причине. Я'Я пытаюсь понять плюсы и минусы.SORTKEY (type_id)
SORTKEY (stamp)
SORTKEY (type_id,stamp)
SORTKEY (stamp,type_id)
Благодарю.