Результаты поиска по запросу "apache-spark"

2 ответа

Объединить два RDD в Spark Scala

У меня есть два RDD.rdd1 = (Строка, Строка)

2 ответа

Spark-запрос выполняется очень медленно

У меня есть кластер на AWS с 2 рабами и 1 мастером. Все экземпляры имеют тип m1.large. У меня работает спарк версии 1.4. Я оцениваю производительность на 4 м...

3 ответа

Время итераций искры увеличивается экспоненциально при использовании соединения

Я совершенно новичок в Spark и пытаюсь реализовать некоторый итерационный алгоритм кластеризации (ожидание-максимизация) с центроидом, представленным моделью...

ТОП публикаций

2 ответа

Как добавить файл конфигурации в classpath всех исполнителей Spark в Spark 1.2.0?

Я использую Typesafe Config,https://github.com/typesafehub/config, для параметризации задания Spark, работающего в режиме кластера пряжи, с помощью файла кон...

2 ответа

Установка путей к классам искры в EC2: spark.driver.extraClassPath и spark.executor.extraClassPath

Уменьшение размера jar приложения путем предоставления spark-classPath для зависимостей maven:В моем кластере есть 3 экземпляра ec2, на которых работает hado...

1 ответ

СДР Spark cache не отображается в Web-интерфейсе Spark History - Хранилище

я использую

3 ответа

Spark Launcher бесконечно ждет завершения работы

Я пытаюсь отправить JAR с заданием Spark в кластер YARN из кода Java. Я использую SparkLauncher для отправки примера SparkPi:

2 ответа

Как бороться с задачами, выполняющимися слишком долго (по сравнению с другими в работе) в Yarn-клиенте?

8 ответов

Как извлечь лучшие параметры из CrossValidatorModel

Я хочу найти параметры

1 ответ

Как передать файлы на главный узел?

Я уже написал код на python для реализации двоичной классификации, и я хочу распараллелить этот процесс классификации на основе разных файлов данных на моем ...