Результаты поиска по запросу "apache-pig"
Как получить массив / пакет элементов из группы Hive оператором?
Я хочу сгруппировать по заданному полю и получить вывод с сгруппированными полями. Ниже приведен пример того, чего я пытаюсь достичь: Представьте себе таблицу с именем sample_table с двумя столбцами, как показано ниже: F1 F2 001 111 001 222 001 ...
Свинья: вытащить все кортежи из сгруппированной сумки
Я использую PIG для создания групп из кортежей следующим образом:
Свинья эквивалент SQL GREATEST / LEAST?
Я пытаюсь найти эквивалент свиньифункции SQL
CSV чтение в свинье, CSV-файл содержит запятую
Так что мои данные выглядят примерно так asdf, asdf, "adsf,qwef", asdfКогда я читаю эти данные на свинье, используя PigStorage(',')Он хранит "adsf, qwef" в виде двух данных и сохраняет его как { "adsf } { qwef" }Я хочу, чтобы цитаты ...
Локальный режим, группа или join = java.lang.OutOfMemoryError: пространство кучи Java
С помощьюApache Pig версия 0.10.1.21(сообщается), выпуск CentOS 6.3 (окончательный вариант), jdk1.6.0_31 (Песочница Hortonworks v1.2 в Virtualbox, с 3,5 ГБ ОЗУ) $ cat data.txt 11,11,22 33,34,35 47,0,21 33,6,51 56,6,11 11,25,67 $ cat GrpTest.pig ...
Загрузить файл, разделенный двойным двоеточием :: in pig
Ниже приведен пример набора данных, разделенный двойным двоеточием (: :).
Apache Pig: Загрузите файл, который показывает хорошо, используя hadoop fs -text
У меня есть файлы с именем part-r-000 [0-9] [0-9] и содержащие поля, разделенные табуляцией. Я могу просмотреть их, используя