Результаты поиска по запросу "mapreduce"
управляющий итератор в mapreduce
Я пытаюсь найти сумму любых заданных точек, используя hadoop. У меня проблема с получением всех значений от данного ключа в одном редукторе. Похоже на это.Ра...
MultipleOutputFormat в hadoop
Я новичок в Hadoop. Я пробую программу Wordcount.Теперь, чтобы попробовать несколько выходных файлов, я использую
Неожиданные результаты в Spark MapReduce
Я новичок в Spark и хочу понять, как MapReduce работает под капотом, чтобы убедиться, что я правильно его использую.Эта почта предоставил отличный ответ, но ...
Изменить префикс выходного имени файла для DataFrame.write ()
Выходные файлы, сгенерированные с помощью метода Spark SQL DataFrame.write (), начинаются с префикса basename «part». например
Какой самый эффективный способ сделать отсортированное сокращение в PySpark?
Я анализирую своевременные отчеты об эффективности внутренних рейсов США с 2015 года. Мне нужно сгруппировать по номеру хвоста и сохранить отсортированный по...
IllegalAccessError для StopWatch гуавы из org.apache.hadoop.mapreduce.lib.input.FileInputFormat.listStatus
Я пытаюсь запустить небольшое искровое приложение и получаю следующее исключение:
Как сериализовать объект в hadoop (в HDFS)
У меня есть HashMap <String, ArrayList <Integer>>. Я хочу сериализовать мой объект HashMap (hmap) в расположение HDFS, а затем десериализовать ег...
Spark java.lang.StackOverflowError
Я использую спарк, чтобы вычислить рейтинг страниц отзывов пользователей, но я продолжаю получать Spark