Результаты поиска по запросу "apache-spark-sql"
Изменение свойства столбца Spark Dataframe
Я хочу изменить свойство Nullable определенного столбца в кадре данных Spark.Если я распечатаю схему информационного кадра в настоящее время, это выглядит та...
Переименование вложенных элементов в Scala Spark Dataframe
У меня есть фрейм данных Spark Scala с вложенной структурой:
Spark SQL, как взорваться, не теряя нулевые значения
У меня есть датафрейм, который я пытаюсь сплющить. Как часть процесса, я хочу разобрать его, поэтому, если у меня есть столбец массивов, каждое значение масс...
Spark загрузить данные и добавить имя файла в виде столбца данных
Я загружаю некоторые данные в Spark с помощью функции-оболочки:
PySpark: StructField (…,…, False) всегда возвращает «nullable = true» вместо «nullable = false»
Я новичок в PySpark и сталкиваюсь со странной проблемой. Я пытаюсь установить для некоторого столбца ненулевое значение при загрузке набора данных CSV. Я мог...
Как подключиться к серверу удаленного улья из спарка
Я использую spark локально и хочу получить доступ к таблицам Hive, которые расположены в удаленном кластере Hadoop.Я могу получить доступ к таблицам улья, за...
Применение пользовательских функций к GroupedData в PySpark (с примером работающего Python)
У меня есть этот код Python, который запускается локально в кадре данных панд: