Результаты поиска по запросу "mapreduce"
Как реализовать сортировку в hadoop?
Моя проблема заключается в сортировке значений в файле. ключи и значения являются целыми числами и должны содержать ключи отсортированных значений. key value 1 24 3 4 4 12 5 23выход: 1 24 5 23 4 12 3 4Я работаю с массивными данными и должен ...
Какова цель «Uber Mode» в Hadoop?
Привет, я новичок с большими данными. Я искал по всему интернету, чтобы найти, что именно Uber Mode. Чем больше я искал, тем больше я запутался. Кто-нибудь м...
Ошибка потоковой передачи в Python «ОШИБКА streaming.StreamJob: задание не выполнено!» И трассировка стека: ExitCodeException exitCode = 134
Я пытаюсь запустить скрипт Python на кластере Hadoop, используя Hadoop Streaming для анализа настроений. Тот же скрипт, который я запускаю на локальной машин...
Лучший способ сделать «ПРИСОЕДИНЕНИЕ» один-ко-многим в CouchDB
Я ищу CouchDB, эквивалентный "SQL-соединениям".В моем примере есть документы CouchDB, которые являются элементами списка:
Класс не найден в работе Hadoop
У меня есть работа по уменьшению карты, которая получает информацию от DocumentDB. Я добавил файлы jar в директорию lib в своем исходном коде, а также исполь...
Размер сплита против размера блока в Hadoop
Какова взаимосвязь между размером разделения и размером блока в Hadoop? Как я читаю вэтотразмер разбиения должен быть n-кратным размером блока (n - целое чис...
вывод одной программы mapreduce как ввод в другую программу mapreduce
Я пытаюсь простой пример, в котором вывод одного задания MapReduce должен быть ввод другого задания MapReduce.Поток должен быть таким:
Проблемы с загрузкой из-за искры
Я пытаюсь запустить простую Java / программу Map / Reduce, используя spark over yarn (Cloudera Hadoop 5.2 на CentOS). Я пробовал это 2 разными способами. Пер...
Разница между диспетчером приложений и мастером приложений в YARN?
Я понял, как работает MRv1. Теперь я пытаюсь понять MRv2. В чем разница между Application Manager и Application Master в YARN?