Результаты поиска по запросу "hadoop-streaming"
Amazon MapReduce лучшие практики для анализа журналов
Я анализирую журналы доступа, сгенерированные Apache, Nginx, Darwin (сервер потокового видео) и собираю статистику для каждого доставленного файла по дате / рефереру / пользователю. Тонны журналов генерируются каждый час, и это число, вероятно, ...
Выполнение задания с использованием потоковой передачи hadoop и mrjob: PipeMapRed.waitOutputThreads (): не удалось выполнить подпроцесс с кодом 1
Эй, я довольно новичок в мире больших данных. Я наткнулся на этот ...
Потоковая передача Hadoop - удаление конечной вкладки с выхода редуктора
У меня есть потоковое задание Hadoop, вывод которого не содержит пары ключ / значение. Вы можете думать об этом как о парах только для значений или пар тольк...
Новый пользователь SSH hadoop
Установка Hadoop на кластер с одним узлом, любая идея, почему нам нужно создать следующее Зачем нам нужен SSH-доступ для нового пользователя? Почему он должен иметь возможность подключиться к своей учетной записи? Почему я должен указывать ...
Ошибка потоковой передачи в Python «ОШИБКА streaming.StreamJob: задание не выполнено!» И трассировка стека: ExitCodeException exitCode = 134
Я пытаюсь запустить скрипт Python на кластере Hadoop, используя Hadoop Streaming для анализа настроений. Тот же скрипт, который я запускаю на локальной машин...
Команда hdfs устарела в hadoop
Как я следую нижеприведенной процедуре:http://www.codeproject.com/Articles/757934/Apache-Hadoop-for-Windows-Platform https://www.youtube.com/watch?v=VhxWig96...