Агрегирование запросов в Cassandra CQL
В настоящее время мы оцениваем Cassandra как хранилище данных для аналитического приложения. План состоял в том, чтобы выгружать необработанные данные в Cassandra, а затем выполнять по ним запросы агрегации. Глядя на CQL, он не поддерживает некоторые традиционные операторы SQL, такие как:
Типичные функции агрегации, такие как среднее значение, сумма, число-различие и т. Д.Групповые операторыЯ не нашел ничего, что может помочь в достижении вышеизложенного в документации. Также проверил, были ли какие-либо хуки для предоставления таких функций как расширения. Скажите, как в map-Reduce базы данных в Mongodb, или пользовательские функции в реляционных БД.
Люди действительно говорят о платной Datastax Enterprise Edition, и это тоже достигается не с помощью простой Cassandra, а с помощью отдельных компонентов, таких как Hadoop-Hive-Pig-Hadoop и т. Д. Или есть предложения по выполнению необходимых предварительных агрегаций перед выгрузкой данных в БД. Кассандра пишет быстро.
Это выглядело слишком много накладных расходов, по крайней мере, для базовых вещей, которые нам нужны. Я что-то упустил здесь?
Буду очень признателен за помощь в этом.