Результаты поиска по запросу "pyspark-sql"

1 ответ

Spark 2.0: относительный путь в абсолютном URI (спарк-склад)

Я пытаюсь перейти с Spark 1.6.1 на Spark 2.0.0 и получаю странную ошибку при попытке прочитать CSV-файл в SparkSQL. Ранее, когда я читал файл с локального ди...

1 ответ

Spark ML Pipeline вызывает java.lang.Exception: не удалось скомпилировать… Код… выходит за пределы 64 КБ

Используя Spark 2.0, я пытаюсь запустить простой VectorAssembler в ML-конвейере pyspark, например:

4 ответа

Как выбрать последнюю строку, а также как получить доступ к фрейму данных PySpark по индексу?

ТОП публикаций

1 ответ

Apache искра, имеющая дело с заявлениями случая

Я имею дело с преобразованием кода SQL в код PySpark и натолкнулся на некоторые операторы SQL. Я не знаю, как подойти к описанию случаев в pyspark? Я планиру...

1 ответ

Как реализовать автоинкремент в Spark SQL (PySpark)

Мне нужно реализовать столбец автоинкремента в моей таблице спарк SQL, как я могу это сделать. Пожалуйста, ведите меня. я использую pyspark 2.0Спасибо калян

3 ответа

Ошибка PySpark: AttributeError: у объекта 'NoneType' нет атрибута '_jvm'

У меня есть набор данных метки времени, который находится в форматеИ я написал udf в pyspark, чтобы обработать этот набор данных и вернуть в качестве карты з...

1 ответ

Как сделать математическую операцию с двумя столбцами в фрейме данных, используя pyspark

У меня есть датафрейм с тремя столбцами "x", "y" и "z"

1 ответ

Spark 2.0: переопределение параметров SparkSession с помощью GetOrCreate и НЕ видеть изменений в WebUI

1 ответ

PySpark: вычислить максимум строки подмножества столбцов и добавить к существующему фрейму данных

Я хотел бы вычислить максимум поднабора столбцов для каждой строки и добавить его в качестве нового столбца для существующего

1 ответ

GroupByKey и создавать списки значений pyspark sql dataframe

Итак, у меня есть искровой датафрейм, который выглядит так: