Результаты поиска по запросу "mapreduce"
Как работает алгоритм сортировки MapReduce?
Одним из основных примеров, который используется при демонстрации возможностей MapReduce, являетсяТест Терасорт, У меня возникли проблемы с пониманием основ ...
Получение результатов MapReduce на RIAK (с использованием клиента Java)
Я храню POJO Person (4 строковых поля - id, name, lastUpdate, Data) на RIAK, а затем пытаюсь получить эти объекты с помощью MapReduce. Я делаю это очень пох...
Обратные ключи редуктора сортировки
Каков наилучший подход, чтобы получить ключи вывода карты для редуктора в обратном порядке? По умолчанию редуктор получает все ключи в порядке возрастания кл...
Когда в Hadoop начинается сокращение задач?
В Hadoop, когда начинаются задачи сокращения? Они начинаются после того, как определенный процент (порог) картографов завершен? Если так, этот порог установл...
Hive over HBase против Hive over HDFS
Мои данные не нужно загружать в режиме реального времени, поэтому мне не нужно использовать HBASE, но мне было интересно, есть ли какие-либо преимущества в п...
Как справиться с генерацией идентификатора на кластере hadoop?
Я строю словарь на кластере Hadoop и нужно создатьnumeric идентификатор для каждого токена. Как я должен это делать?
Где сортировка используется в фазе MapReduce и почему?
Я новичок в Hadoop здесь. Непонятно, почему мы должны иметь возможность сортировать по ключам при использовании hadoop mapreduce? После фазы отображения нам ...
Карта Mongodb уменьшить на многоядерном сервере
У меня есть mongodb с тысячами записей с очень длинными векторами. Я ищу корреляции между входным вектором с моим набором данных MDB, используя определенный ...
Объединение двух наборов данных в Mapreduce / Hadoop
Кто-нибудь знает, как реализовать операцию Natural-Join между двумя наборами данных в Hadoop? Более конкретно, вот что мне нужно сделать: У меня есть два н...