Результаты поиска по запросу "mapreduce"

4 ответа

Как работает алгоритм сортировки MapReduce?

Одним из основных примеров, который используется при демонстрации возможностей MapReduce, являетсяТест Терасорт, У меня возникли проблемы с пониманием основ ...

1 ответ

Получение результатов MapReduce на RIAK (с использованием клиента Java)

Я храню POJO Person (4 строковых поля - id, name, lastUpdate, Data) на RIAK, а затем пытаюсь получить эти объекты с помощью MapReduce. Я делаю это очень пох...

3 ответа

Обратные ключи редуктора сортировки

Каков наилучший подход, чтобы получить ключи вывода карты для редуктора в обратном порядке? По умолчанию редуктор получает все ключи в порядке возрастания кл...

ТОП публикаций

8 ответов

Когда в Hadoop начинается сокращение задач?

В Hadoop, когда начинаются задачи сокращения? Они начинаются после того, как определенный процент (порог) картографов завершен? Если так, этот порог установл...

3 ответа

Hive over HBase против Hive over HDFS

Мои данные не нужно загружать в режиме реального времени, поэтому мне не нужно использовать HBASE, но мне было интересно, есть ли какие-либо преимущества в п...

3 ответа

Как справиться с генерацией идентификатора на кластере hadoop?

Я строю словарь на кластере Hadoop и нужно создатьnumeric идентификатор для каждого токена. Как я должен это делать?

2 ответа

Где сортировка используется в фазе MapReduce и почему?

Я новичок в Hadoop здесь. Непонятно, почему мы должны иметь возможность сортировать по ключам при использовании hadoop mapreduce? После фазы отображения нам ...

1 ответ

Карта Mongodb уменьшить на многоядерном сервере

У меня есть mongodb с тысячами записей с очень длинными векторами. Я ищу корреляции между входным вектором с моим набором данных MDB, используя определенный ...

2 ответа

Hadoop: java.lang.ClassCastException: org.apache.hadoop.io.LongWritable не может быть приведен к org.apache.hadoop.io.Text

Моя программа выглядит так

3 ответа

Объединение двух наборов данных в Mapreduce / Hadoop

Кто-нибудь знает, как реализовать операцию Natural-Join между двумя наборами данных в Hadoop? Более конкретно, вот что мне нужно сделать: У меня есть два н...