Результаты поиска по запросу "apache-pig"

6 ответов

Ошибка в свинье при загрузке данных

4 ответа

Как подавить распространение бесполезной информации при использовании команды DUMP при использовании grunt через 'pig -x local'?

Я работаю с PigLatin, использую grunt, и каждый раз, когда я «сбрасываю» материалы, моя консоль забивается бла-бла-бла, бла-не-информация, есть ли способ прекратить все это? grunt> A = LOAD 'testingData' USING PigStorage(':'); dump A; ...

2 ответа

Форматирование даты в генерации выписки

В Pig у меня есть утверждение, которое в основном добавляет дату к моим сгенерированным значениям. Data = FOREACH Input GENERATE (CurrentTime()),FLATTEN(group), COUNT(guid)oas Cnt;Вывод дает мне дату2013-05-25T09:01:38.914-04:00 в ISO8601. Как ...

ТОП публикаций

2 ответа

Локальный режим, группа или join = java.lang.OutOfMemoryError: пространство кучи Java

С помощьюApache Pig версия 0.10.1.21(сообщается), выпуск CentOS 6.3 (окончательный вариант), jdk1.6.0_31 (Песочница Hortonworks v1.2 в Virtualbox, с 3,5 ГБ ОЗУ) $ cat data.txt 11,11,22 33,34,35 47,0,21 33,6,51 56,6,11 11,25,67 $ cat GrpTest.pig ...

3 ответа

Pig Batch mode: как установить уровень ведения журнала, чтобы скрыть сообщения журнала INFO?

Используя ApacheСвинья версия 0.10.1.21(Rexported). Когда я выполняю сценарий PIG, появляется много строк журнала INFO, которые выглядят так: 2013-05-18 14:30:12,810 [Thread-28] INFO org.apache.hadoop.mapred.Task - ...

2 ответа

Как получить массив / пакет элементов из группы Hive оператором?

Я хочу сгруппировать по заданному полю и получить вывод с сгруппированными полями. Ниже приведен пример того, чего я пытаюсь достичь: Представьте себе таблицу с именем sample_table с двумя столбцами, как показано ниже: F1 F2 001 111 001 222 001 ...

2 ответа

PIG - найден интерфейс org.apache.hadoop.mapreduce.JobContext, но ожидался класс

Я пытался загрузить стол из улья. Я использую Hcatalog для этого.Я вошел в улей, используя

1 ответ

правильная загрузка даты и времени у свиньи

Я загружаю файл tsv со столбцом datetime и длинным столбцом с:

2 ответа

Использование функции ранга Apache Pig

Я использую функцию ранга Pig 0.11.0 и генерирую ранги для каждого идентификатора в моих данных. Мне нужно ранжировать мои данные определенным образом. Я хоч...

1 ответ

Доступ к файлу hdfs из udf

Я хотел бы получить доступ к файлу из моего звонка в формате udf. Это мой сценарий: files = LOAD '$docs_in' USING PigStorage(';') AS (id, stopwords, id2, file); buzz = FOREACH files GENERATE pigbuzz.Buzz(file, id) as file:bag{(year:chararray, ...