Результаты поиска по запросу "apache-spark-sql"

8 ответов

Как выполнить объединение двух DataFrames с разным количеством столбцов в спарк?

у меня есть 2

1 ответ

Изменение свойства столбца Spark Dataframe

Я хочу изменить свойство Nullable определенного столбца в кадре данных Spark.Если я распечатаю схему информационного кадра в настоящее время, это выглядит та...

1 ответ

Переименование вложенных элементов в Scala Spark Dataframe

У меня есть фрейм данных Spark Scala с вложенной структурой:

ТОП публикаций

3 ответа

Spark SQL, как взорваться, не теряя нулевые значения

У меня есть датафрейм, который я пытаюсь сплющить. Как часть процесса, я хочу разобрать его, поэтому, если у меня есть столбец массивов, каждое значение масс...

1 ответ

Удаление нескольких столбцов из фрейма данных Spark путем итерации по столбцам из списка имен столбцов Scala

1 ответ

Spark загрузить данные и добавить имя файла в виде столбца данных

Я загружаю некоторые данные в Spark с помощью функции-оболочки:

1 ответ

PySpark: StructField (…,…, False) всегда возвращает «nullable = true» вместо «nullable = false»

Я новичок в PySpark и сталкиваюсь со странной проблемой. Я пытаюсь установить для некоторого столбца ненулевое значение при загрузке набора данных CSV. Я мог...

1 ответ

Как подключиться к серверу удаленного улья из спарка

Я использую spark локально и хочу получить доступ к таблицам Hive, которые расположены в удаленном кластере Hadoop.Я могу получить доступ к таблицам улья, за...

3 ответа

Применение пользовательских функций к GroupedData в PySpark (с примером работающего Python)

У меня есть этот код Python, который запускается локально в кадре данных панд:

2 ответа

Fgrowth вычислительная ассоциация в pyspark vs scala