Результаты поиска по запросу "hadoop"

4 ответа

Не удалось установить разрешения для пути: \ tmp

Failed to set permissions of path: \tmp\hadoop-MayPayne\mapred\staging\MayPayne2016979439\.staging to 0700Я получаю эту ошибку, когда выполняется задание MapReduce, я использовал hadoop 1.0.4, затем я узнал, что это известная проблема, и я ...

4 ответа

Выполнение задания с использованием потоковой передачи hadoop и mrjob: PipeMapRed.waitOutputThreads (): не удалось выполнить подпроцесс с кодом 1

Эй, я довольно новичок в мире больших данных. Я наткнулся на этот ...

4 ответа

org.apache.hadoop.hbase.PleaseHoldException: мастер инициализируется

Я пытаюсь настроить многоузловой кластер Hbase. Когда я делаю JPS на раба, я получаю 5780 Jps 5558 HQuorumPeer 5684 HRegionServer 1963 DataNode 2093 TaskTracker аналогично на мастере я получаю 4254 SecondaryNameNode 15226 Jps 14982 HMaster 3907 ...

ТОП публикаций

5 ответов

Разница между HBase и Hadoop / HDFS

Это довольно наивный вопрос, но я новичок в парадигме NoSQL и мало что знаю об этом. Так что, если кто-то может помочь мне четко понять разницу между HBase и Hadoop, или если дать несколько указателей, которые могут помочь мне понять разницу. До ...

7 ответов

Размер разделения входных данных Hadoop и размер блока

Я прохожу через полное руководство по Hadoop, где оно четко объясняет разделение входных данных. Это идет как Разделение входных данных не содержит фактических данных, скорее, оно имеет места для хранения данных в HDFS а также Обычно размер ...

5 ответов

$ HADOOP_HOME устарела, Hadoop

Я попытался установить Hadoop на кластер с одним узлом (мой собственный labtop-ubuntu 12.04). Я следовал этому уроку и проверял его построчно два ...

3 ответа

Hadoop MapReduce сортировать уменьшить выход с помощью ключа

внизу есть программа для уменьшения количества слов, содержащая слова нескольких текстовых файлов. Моя цель - получить результат в порядке убывания количества появлений. К сожалению, программа сортирует вывод лексикографически по ключу. Я ...

2 ответа

Hive UDF Текст в массив

Я пытаюсь создать UDF для Hive, который дает мне больше функциональности, чем уже предоставленныйsplit() функция. import org.apache.hadoop.hive.ql.exec.UDF; import org.apache.hadoop.io.Text; public class LowerCase extends UDF { public Text ...

3 ответа

Почему Select Count (*) медленнее чем Select * в улье

Когда я запускаю запросы вVirtualBox Sandbox с ульями я чувствуюSelect count(*) слишком много медленнее, чемSelect *. Кто-нибудь может объяснить, что происходит позади? И почему эта задержка происходит?

3 ответа

Переменные среды Rstudio-сервера не загружаются?

Я пытаюсь запустить rhadoop в дистрибутиве hadoop Cloudera (не помню, CDH3 или 4), и столкнулся с проблемой: сервер Rstudio, похоже, не распознает мои глобальные переменные. В моем файле /etc/profile.d/r.sh у меня есть: export ...