Результаты поиска по запросу "bigdata"
R: Расширение R-фактора в фиктивные столбцы для каждого факторного уровня
У меня довольно большой фрейм данных в R с двумя столбцами. Я пытаюсь сделать из
удаление дубликатов из фрейма данных
Я работаю над большим набором данных с n ковариатами. Многие из строк являются дубликатами. Чтобы идентифицировать дубликаты, мне нужно использовать подмножество ковариат для создания идентификационной переменной. То есть (n-x) ковариаты не имеют ...
Большое спасибо за ответ. но на самом деле мне нужно проверить, является ли схема куста той же самой Sas-схемой, поэтому мне нужно указать "timestamptype" в кусте с Datetime в SAS, который имеет тип NUm, а также тип Integer в кусте имеет соответствующий тип данных как NUM в SAS, так что в основном мне также нужно сравнить столбец «Формат» в схеме SAS со схемой улья.
вниваю два кадра данных (в основном это схемы двух разных источников данных, один из куста, а другой из SAS9.2) Мне нужно проверить структуру для обоих источников данных, поэтому я преобразовал схему в два кадра данных, и вот они: Схема SAS ...
Как получить массив / пакет элементов из группы Hive оператором?
Я хочу сгруппировать по заданному полю и получить вывод с сгруппированными полями. Ниже приведен пример того, чего я пытаюсь достичь: Представьте себе таблицу с именем sample_table с двумя столбцами, как показано ниже: F1 F2 001 111 001 222 001 ...