Результаты поиска по запросу "mapreduce"

4 ответа

управляющий итератор в mapreduce

Я пытаюсь найти сумму любых заданных точек, используя hadoop. У меня проблема с получением всех значений от данного ключа в одном редукторе. Похоже на это.Ра...

3 ответа

MultipleOutputFormat в hadoop

Я новичок в Hadoop. Я пробую программу Wordcount.Теперь, чтобы попробовать несколько выходных файлов, я использую

1 ответ

Неожиданные результаты в Spark MapReduce

Я новичок в Spark и хочу понять, как MapReduce работает под капотом, чтобы убедиться, что я правильно его использую.Эта почта предоставил отличный ответ, но ...

ТОП публикаций

3 ответа

Как сгруппировать вывод mongodb - mapReduce?

2 ответа

Изменить префикс выходного имени файла для DataFrame.write ()

Выходные файлы, сгенерированные с помощью метода Spark SQL DataFrame.write (), начинаются с префикса basename «part». например

6 ответов

Сортировка больших данных с помощью MapReduce / Hadoop

1 ответ

Какой самый эффективный способ сделать отсортированное сокращение в PySpark?

Я анализирую своевременные отчеты об эффективности внутренних рейсов США с 2015 года. Мне нужно сгруппировать по номеру хвоста и сохранить отсортированный по...

9 ответов

IllegalAccessError для StopWatch гуавы из org.apache.hadoop.mapreduce.lib.input.FileInputFormat.listStatus

Я пытаюсь запустить небольшое искровое приложение и получаю следующее исключение:

1 ответ

Как сериализовать объект в hadoop (в HDFS)

У меня есть HashMap <String, ArrayList <Integer>>. Я хочу сериализовать мой объект HashMap (hmap) в расположение HDFS, а затем десериализовать ег...

3 ответа

Spark java.lang.StackOverflowError

Я использую спарк, чтобы вычислить рейтинг страниц отзывов пользователей, но я продолжаю получать Spark