Результаты поиска по запросу "apache-spark"

1 ответ

Как я могу обновить широковещательную переменную в потоковой передаче искры?

Я полагаю, у меня есть довольно распространенный вариант использования потоковой передачи искры:У меня есть поток объектов, которые я хотел бы отфильтровать ...

4 ответа

Как заставить Spark, Python и MongoDB работать вместе

Я испытываю трудности при правильном соединении этих компонентов. У меня установлена ​​и успешно работает Spark, я могу запускать задания локально, автономно...

1 ответ

Как Spark DataFrame обрабатывает Pandas DataFrame, который больше, чем память

Сейчас я изучаю Spark, и, похоже, это решение для больших данных для Pandas Dataframe, но у меня есть этот вопрос, который заставляет меня сомневаться.В наст...

ТОП публикаций

4 ответа

Pyspark и PCA: как я могу извлечь собственные векторы этого PCA? Как я могу рассчитать, сколько дисперсии они объясняют?

Я уменьшаю размерность

6 ответов

Инициализировать RDD для очистки

У меня есть RDD под названием

1 ответ

Проблемы с выполнением нескольких запросов с использованием Spark и HiveSQL

Я надеюсь, что кто-то может помочь мне с этим вопросом. Внутри спарк-оболочки, если я попытаюсь что-то вроде ниже:

2 ответа

Apache Spark создает исключение NullPointerException при обнаружении отсутствующей функции

У меня странная проблема с PySpark при индексации столбца строк в функциях. Вот мой файл tmp.csv:

1 ответ

Обойти первую строку каждого файла в Spark (Scala)

Я обрабатываю папку S3, содержащую файлы csv.gz в Spark. Каждый файл csv.gz имеет заголовок, который содержит имена столбцов.Я загружаю содержащиеся в Spark ...

1 ответ

Как добавить Spark Dataframe в конец другого dataframe?

я могу использовать

1 ответ

Умножение матриц в Apache Spark [закрыто]

Я пытаюсь выполнить матричное умножение, используя Apache Spark и Java.У меня есть 2 основных вопроса:Как создать RDD, который может представлять матрицу в A...