Результаты поиска по запросу "hadoop"
Не удалось установить разрешения для пути: \ tmp
Failed to set permissions of path: \tmp\hadoop-MayPayne\mapred\staging\MayPayne2016979439\.staging to 0700Я получаю эту ошибку, когда выполняется задание MapReduce, я использовал hadoop 1.0.4, затем я узнал, что это известная проблема, и я ...
Выполнение задания с использованием потоковой передачи hadoop и mrjob: PipeMapRed.waitOutputThreads (): не удалось выполнить подпроцесс с кодом 1
Эй, я довольно новичок в мире больших данных. Я наткнулся на этот ...
org.apache.hadoop.hbase.PleaseHoldException: мастер инициализируется
Я пытаюсь настроить многоузловой кластер Hbase. Когда я делаю JPS на раба, я получаю 5780 Jps 5558 HQuorumPeer 5684 HRegionServer 1963 DataNode 2093 TaskTracker аналогично на мастере я получаю 4254 SecondaryNameNode 15226 Jps 14982 HMaster 3907 ...
Разница между HBase и Hadoop / HDFS
Это довольно наивный вопрос, но я новичок в парадигме NoSQL и мало что знаю об этом. Так что, если кто-то может помочь мне четко понять разницу между HBase и Hadoop, или если дать несколько указателей, которые могут помочь мне понять разницу. До ...
Размер разделения входных данных Hadoop и размер блока
Я прохожу через полное руководство по Hadoop, где оно четко объясняет разделение входных данных. Это идет как Разделение входных данных не содержит фактических данных, скорее, оно имеет места для хранения данных в HDFS а также Обычно размер ...
$ HADOOP_HOME устарела, Hadoop
Я попытался установить Hadoop на кластер с одним узлом (мой собственный labtop-ubuntu 12.04). Я следовал этому уроку и проверял его построчно два ...
Hadoop MapReduce сортировать уменьшить выход с помощью ключа
внизу есть программа для уменьшения количества слов, содержащая слова нескольких текстовых файлов. Моя цель - получить результат в порядке убывания количества появлений. К сожалению, программа сортирует вывод лексикографически по ключу. Я ...
Hive UDF Текст в массив
Я пытаюсь создать UDF для Hive, который дает мне больше функциональности, чем уже предоставленныйsplit() функция. import org.apache.hadoop.hive.ql.exec.UDF; import org.apache.hadoop.io.Text; public class LowerCase extends UDF { public Text ...
Почему Select Count (*) медленнее чем Select * в улье
Когда я запускаю запросы вVirtualBox Sandbox с ульями я чувствуюSelect count(*) слишком много медленнее, чемSelect *. Кто-нибудь может объяснить, что происходит позади? И почему эта задержка происходит?
Переменные среды Rstudio-сервера не загружаются?
Я пытаюсь запустить rhadoop в дистрибутиве hadoop Cloudera (не помню, CDH3 или 4), и столкнулся с проблемой: сервер Rstudio, похоже, не распознает мои глобальные переменные. В моем файле /etc/profile.d/r.sh у меня есть: export ...