Результаты поиска по запросу "pyspark"
PySpark: взять среднее значение столбца после использования функции фильтра
Я использую следующий код, чтобы получить средний возраст людей, чья зарплата превышает определенный порог.
SparkSQL - функция задержки?
Я вижу в этомПост DataBricksВ SparkSql есть поддержка оконных функций, в частности я пытаюсь использовать оконную функцию lag ().У меня есть строки транзакци...
Работает ли предикатный режим pushdown с JDBC?
В соответствии сэтотCatalyst применяет логические оптимизации, такие как предикатное нажатие. Оптимизатор может выдвигать предикаты фильтра вниз в источник д...
Передача функций класса в PySpark RDD
У меня есть класс с именем some_class () в файле Python:
Доступ к Spark из приложения Flask
Я написал простое приложение Flask для передачи данных в Spark. Сценарий работает в IPython Notebook, но не тогда, когда я пытаюсь запустить его на своем соб...
Как преобразовать RDD со столбцом SparseVector в DataFrame со столбцом как вектор
у меня естьРДД с кортежем значений (String, SparseVector), и я хочу создатьDataFrame с использованиемРДД, Чтобы получить (метка: строка, функции: вектор)Data...
Создать Spark DataFrame. Невозможно вывести схему для типа: <тип 'float'>
Может ли кто-нибудь помочь мне решить эту проблему с Spark DataFrame?Когда я делаю
Конвертировать RDD в итерируемый: PySpark?
У меня есть RDD, который я создаю, загружая текстовый файл и предварительно обрабатывая его. Я не хочу собирать его и сохранять на диск или в память (целые д...
PySpark DataFrames - способ перечисления без преобразования в панды?
У меня очень большойpyspark.sql.dataframe.DataFrame по имени дф. Мне нужен какой-то способ перечисления записей - таким образом, возможность доступа к записи...