Экспорт большого количества данных из Кассандры в CSV

Я использую Cassandra 2.0.9 для хранения довольно больших объемов данных, скажем, 100 Гб, в одном семействе столбцов. Я хотел бы быстро экспортировать эти данные в CSV. Я старался:

sstable2json - он генерирует довольно большие файлы json, которые трудно анализировать - поскольку инструмент помещает данные в одну строку и использует сложную схему (например, 300 МБ файл данных = ~ 2 ГБ json), для создания дампа требуется много времени, а Кассандре нравится менять источник имена файлов в соответствии с внутренним механизмомCOPY - вызывает таймауты на довольно быстрых экземплярах EC2 для большого количества записейЗАХВАТИТЬ - как и выше, вызывает таймаутычитает с нумерацией страниц - Я использовал для этого timeuuid, но он возвращает около 1,5 тыс. Записей в секунду.

Я использую инстанс Amazon Ec2 с быстрым хранилищем, 15 Гб оперативной памяти и 4 ядра

Есть ли лучший вариант для экспорта гигабайт данных из Кассандры в CSV?

Ответы на вопрос(2)

Ваш ответ на вопрос