Результаты поиска по запросу "emr"

2 ответа

Нужен совет по стратегии для переноса больших таблиц из RDS в DynamoDB

2 ответа

Как MapReduce читает из нескольких входных файлов?

Я разрабатываю код для чтения данных и записи вHDFS с помощьюmapreduce, Однако, когда у меня есть несколько файлов, я не понимаю, как это обрабатывается. Входной путь к мапперу - это имя каталога, как видно из вывода String filename = ...

1 ответ

YARN: В чем разница между числом исполнителей и ядрами исполнителей в Spark?

ТОП публикаций

1 ответ

Почему Yarn на EMR не выделяет все узлы для выполнения заданий Spark?

Я работаю над Apache Spark на Amazon Elastic Map Reduce (EMR). В настоящее время я работаю на emr-4.1.0, который включает Amazon Hadoop 2.6.0 и Spark 1.5.0.К...

0 ответов

Как настроить Zeppelin для работы с удаленным кластером EMR Yarn

2 ответа

Как указать сопоставленные конфигурации и параметры java с помощью пользовательского jar в CLI с помощью Amazon EMR?

Я хотел бы знать, как указать конфигурации mapreduce, такие как mapred.task.timeout, mapred.min.split.sizeи т.д., при запуске потокового задания с использованием пользовательского jar. Мы можем использовать следующий способ, чтобы указать эти ...

6 ответов

Обнаружена проблема с гуавой # 1635, которая указывает на то, что используется версия гуавы менее 16.01

2 ответа

Spark. Какой тип экземпляра предпочтителен для кластера AWS EMR? [закрыто]

Я использую некоторые алгоритмы машинного обучения на кластере EMR Spark. Мне интересно, какой тип экземпляра использовать, чтобы я мог получить оптимальное ...

4 ответа

Слишком много открытых файлов в EMR

Я получаю следующие исключения в моих редукторах:

1 ответ

Как избежать чтения старых файлов из S3 при добавлении новых данных?

Раз в 2 часа запускается работа spark для преобразования некоторых файлов tgz в паркет. Задание добавляет новые данные в существующий паркет в s3: