Результаты поиска по запросу "mapreduce"
Как сериализовать объект в hadoop (в HDFS)
У меня есть HashMap <String, ArrayList <Integer>>. Я хочу сериализовать мой объект HashMap (hmap) в расположение HDFS, а затем десериализовать ег...
IllegalAccessError для StopWatch гуавы из org.apache.hadoop.mapreduce.lib.input.FileInputFormat.listStatus
Я пытаюсь запустить небольшое искровое приложение и получаю следующее исключение:
Какой самый эффективный способ сделать отсортированное сокращение в PySpark?
Я анализирую своевременные отчеты об эффективности внутренних рейсов США с 2015 года. Мне нужно сгруппировать по номеру хвоста и сохранить отсортированный по...
Изменить префикс выходного имени файла для DataFrame.write ()
Выходные файлы, сгенерированные с помощью метода Spark SQL DataFrame.write (), начинаются с префикса basename «part». например
Неожиданные результаты в Spark MapReduce
Я новичок в Spark и хочу понять, как MapReduce работает под капотом, чтобы убедиться, что я правильно его использую.Эта почта предоставил отличный ответ, но ...
Количество редукторов по умолчанию
В Hadoop, если мы не установили количество редукторов, сколько будет создано число редукторов?Как число картографов зависит от(общий размер данных) / (входно...
Что такое файл последовательности в hadoop?
Я новичок в Map-Reduce, и я хочу понять, что такое ввод данных в файл последовательности? Я учился в книге Hadoop, но мне было трудно это понять.