Результаты поиска по запросу "bigdata"

1 ответ

Лучший способ подготовиться к вопросам дизайна и архитектуры, связанным с большими данными [закрыто]

1 ответ

R: Расширение R-фактора в фиктивные столбцы для каждого факторного уровня

У меня довольно большой фрейм данных в R с двумя столбцами. Я пытаюсь сделать из

2 ответа

«Обратите внимание, что из-за логической позиции, в которой оценивается предложение HAVING, выражения, спроецированные предложением SELECT, не видны предложению HAVING».

ТОП публикаций

3 ответа

удаление дубликатов из фрейма данных

Я работаю над большим набором данных с n ковариатами. Многие из строк являются дубликатами. Чтобы идентифицировать дубликаты, мне нужно использовать подмножество ковариат для создания идентификационной переменной. То есть (n-x) ковариаты не имеют ...

1 ответ

Ограничения памяти в таблице данных: отрицательные векторы длины не допускаются

1 ответ

Большое спасибо за ответ. но на самом деле мне нужно проверить, является ли схема куста той же самой Sas-схемой, поэтому мне нужно указать "timestamptype" в кусте с Datetime в SAS, который имеет тип NUm, а также тип Integer в кусте имеет соответствующий тип данных как NUM в SAS, так что в основном мне также нужно сравнить столбец «Формат» в схеме SAS со схемой улья.

вниваю два кадра данных (в основном это схемы двух разных источников данных, один из куста, а другой из SAS9.2) Мне нужно проверить структуру для обоих источников данных, поэтому я преобразовал схему в два кадра данных, и вот они: Схема SAS ...

1 ответ

Модель данных Кассандры для временных рядов

2 ответа

Как получить массив / пакет элементов из группы Hive оператором?

Я хочу сгруппировать по заданному полю и получить вывод с сгруппированными полями. Ниже приведен пример того, чего я пытаюсь достичь: Представьте себе таблицу с именем sample_table с двумя столбцами, как показано ниже: F1 F2 001 111 001 222 001 ...

1 ответ

 хотя - я перебрал массив заголовков CSV.

4 ответа

Загрузите небольшую случайную выборку из большого файла CSV в кадр данных R

Обрабатываемый CSV-файл не помещается в память. Как можно прочитать ~ 20К случайных строк этого, чтобы сделать основную статистику по выбранному фрейму данных?