Результаты поиска по запросу "pyspark"

1 ответ

PySpark: взять среднее значение столбца после использования функции фильтра

Я использую следующий код, чтобы получить средний возраст людей, чья зарплата превышает определенный порог.

1 ответ

SparkSQL - функция задержки?

Я вижу в этомПост DataBricksВ SparkSql есть поддержка оконных функций, в частности я пытаюсь использовать оконную функцию lag ().У меня есть строки транзакци...

1 ответ

Работает ли предикатный режим pushdown с JDBC?

В соответствии сэтотCatalyst применяет логические оптимизации, такие как предикатное нажатие. Оптимизатор может выдвигать предикаты фильтра вниз в источник д...

ТОП публикаций

1 ответ

Передача функций класса в PySpark RDD

У меня есть класс с именем some_class () в файле Python:

2 ответа

Spark DataFrame: вычисление среднего значения по строкам (или любой агрегированной операции)

3 ответа

Доступ к Spark из приложения Flask

Я написал простое приложение Flask для передачи данных в Spark. Сценарий работает в IPython Notebook, но не тогда, когда я пытаюсь запустить его на своем соб...

3 ответа

Как преобразовать RDD со столбцом SparseVector в DataFrame со столбцом как вектор

у меня естьРДД с кортежем значений (String, SparseVector), и я хочу создатьDataFrame с использованиемРДД, Чтобы получить (метка: строка, функции: вектор)Data...

1 ответ

Создать Spark DataFrame. Невозможно вывести схему для типа: <тип 'float'>

Может ли кто-нибудь помочь мне решить эту проблему с Spark DataFrame?Когда я делаю

2 ответа

Конвертировать RDD в итерируемый: PySpark?

У меня есть RDD, который я создаю, загружая текстовый файл и предварительно обрабатывая его. Я не хочу собирать его и сохранять на диск или в память (целые д...

2 ответа

PySpark DataFrames - способ перечисления без преобразования в панды?

У меня очень большойpyspark.sql.dataframe.DataFrame по имени дф. Мне нужен какой-то способ перечисления записей - таким образом, возможность доступа к записи...