Результаты поиска по запросу "bigdata"
Не удалось записать данные смещения в zookeeper в kafka-storm
Я настраивал штормовой кластер для расчета трендов в режиме реального времени и другой статистики, однако у меня есть некоторые проблемы с внедрением в этот ...
Экспорт большого количества данных из Кассандры в CSV
Я использую Cassandra 2.0.9 для хранения довольно больших объемов данных, скажем, 100 Гб, в одном семействе столбцов. Я хотел бы быстро экспортировать эти да...
Джанго + Постгрес + Большой временной ряд
Я оцениваю проект с большими, в основном несжимаемыми данными временных рядов, и задаюсь вопросом, является ли Django + Postgres с сырым SQL правильным решен...
Есть ли способ транспонировать данные в Hive?
Можно ли транспонировать данные в Hive? Как в, строки становятся столбцами, а столбцы строки? Если нет функции прямо вверх, есть ли способ сделать это в пару шагов? У меня есть такая таблица: | ID | Names | Proc1 | Proc2 | Proc3 | | 1 | A1 | x ...
Вычесть все пары значений из двух массивов
У меня есть два вектора,
Загрузить массив JSON в Pig
У меня есть файл JSON со следующим форматом
Как работает функция pyspark mapPartitions?
Поэтому я пытаюсь изучить Spark, используя Python (Pyspark). Я хочу знать, как работает функция
Какая функция в spark используется для объединения двух RDD с помощью клавиш
Допустим, у меня есть два следующих RDD со следующими значениями пары ключей.
Вычислить евклидову матрицу расстояний, используя объект big.matrix
У меня есть объект класса
R, проблема с иерархической кластеризацией после анализа множественных соответствий
Я хочу кластеризовать набор данных (600000 наблюдений), и для каждого кластера я хочу получить главные компоненты. Мои векторы состоят из одного электронного...