Результаты поиска по запросу "apache-spark"

2 ответа

локальность данных spark + hadoop

1 ответ

добавление языкового фильтра в твиттер популярные хэштеги - scala

2 ответа

удалите дубликаты из фрейма данных в pyspark

ТОП публикаций

1 ответ

Spark: объединить очень медленно, даже если выходные данные очень малы

1 ответ

Чтение нескольких файлов из каталога с помощью Spark

7 ответов

Spark 1.4 увеличивает maxResultSize память

1 ответ

Есть ли способ переписать Spark RDD отдельно для использования mapPartitions вместо различных?

У меня есть RDD, который слишком велик для последовательного выполнения отдельного оператора без ложных ошибок (например, этап SparkException завершился неуд...

2 ответа

Остановите потоковый контекст в Spark Streaming через некоторое время

Я создаю приложение, которое получает DStreams из Twitter, и единственный способ остановить контекст потоковой передачи - остановить выполнение. Интересно, е...

2 ответа

Линейная регрессия Spark MlLib (Линейные наименьшие квадраты) дает случайные результаты

Я новичок в искусстве и машинном обучении в целом. Я с успехом следил за некоторыми уроками Mllib, я не могу заставить это работать:я нашел пример кода здесь...

1 ответ

Что означает «потоковая передача» в Apache Spark и Apache Flink?

Как я пошел вApache Spark Streaming На сайте я увидел предложение:Spark Streaming позволяет легко создавать масштабируемые отказоустойчивые потоковые приложе...