Результаты поиска по запросу "hadoop"

1 ответ

http://shop.oreilly.com/product/0636920028536.do

астоящее время очень случайный пользовательАпач Махоут [http://mahout.apache.org/]и я подумываю о покупке книгиMahout в действии [http://www.manning.com/owen/], К сожалению, мне очень трудно понять, насколько стоит эта книга - и вижу, как ...

1 ответ

Спасибо за ваше предложение. У меня все работало нормально ...

аюсь Sqoop данных из Teradata для улья. Я думал о следующих шагах: 1) Создайте таблицу Hive со всеми обязательными полями в Hue. 2) Используя команду импорта Sqoop вместе с--map-column-hive атрибут для загрузки данных из Teradata в улей. Как ...

0 ответов

 условие предотвращает ложные срабатывания. (2) 2 части UNION ALL представляют 2 сдвинутые шкалы. Смотрите обновленный ответ

ужен запрос на улей, который мне сложно понять. У меня есть временной ряд, который выглядит так: time source word1 word2 ...etc 2012-02-01 23:43:16.9988243 0001 2B3B FAF0 2012-02-01 23:43:16.9993561 0002 2326 ABAA 2012-02-01 23:43:16.9998879 ...

ТОП публикаций

0 ответов

 подписать слева от ответа

оложим, у меня в настоящее время есть таблица, в которой по 1 строке для каждой учетной записи, а данные в таблицах: Номер аккаунтаДата началаДата окончанияТеперь я хотел бы создать новую таблицу, в которой по 1 строке для каждого дня открытия ...

3 ответа

Потоковая передача Hadoop - удаление конечной вкладки с выхода редуктора

У меня есть потоковое задание Hadoop, вывод которого не содержит пары ключ / значение. Вы можете думать об этом как о парах только для значений или пар только для ключей. Мой потоковый редуктор (скрипт php) выводит записи, разделенные ...

3 ответа

Как объединить группу в один кортеж в Pig?

Из этого: (1, {(1,2), (1,3), (1,4)} ) (2, {(2,5), (2,6), (2,7)} )... Как мы могли создать это? ((1,2),(1,3),(1,4)) ((2,5),(2,6),(2,7))... И как мы могли это сгенерировать? (1, 2, 3, 4) (2, 5, 6, 7)Для одного ряда я знаю, как это сделать. ...

1 ответ

Улей и регулярное выражение

Я пытаюсь отфильтровать все IP-адреса в имени пользователя. Но это действительно не работает должным образом в моем запросе: select distinct regexp_extract(username, '^([0-9]{1,3})\.([0-9]{1,3})\.([0-9]{1,3})\.([0-9]{1,3})$', 0) from ...

0 ответов

 используется для определения разделов задач фреймворка. обычно применяется для операций RDD.

разница междуspark.sql.shuffle.partitions а такжеspark.default.parallelism? Я пытался установить их обоих вSparkSQL, но номер задачи второго этапа всегда 200.

0 ответов

Примечание: проверьте, что $ HADOOP_HOME / etc / hadoop является правильным в вашей среде. И spark-env.sh также содержит экспорт HADOOP_HOME.

аюсь запустить Spark, используя пряжу, и я сталкиваюсь с этой ошибкой: Исключение в потоке "main" java.lang.Exception: При работе с главной 'yarn' в среде должен быть установлен либо HADOOP_CONF_DIR, либо YARN_CONF_DIR. Я не уверен, где ...

1 ответ

И если вам интересно, как JAAS загружает вашу конфигурацию (или если вам нужно отладить вашу конфигурацию, потому что синтаксические ошибки и FileNotFound не сообщаются по умолчанию):

зрабатываем веб-приложение, которое взаимодействует с такими компонентами hadoop, как HDFS, HBase и Impala. Кластер керберизован, мы аутентифицируемся с помощью конфигурации JAAS. Мы настраиваем JAAS в аргументах VM, как ...