Результаты поиска по запросу "spark-dataframe"

1 ответ

Когда использовать Spark DataFrame / Dataset API, а когда использовать обычный RDD?

1 ответ

Вперед заполнить пропущенные значения в Spark / Python

Я пытаюсь заполнить пропущенные значения в моем фрейме данных Spark предыдущим ненулевым значением (если оно существует). Я делал подобные вещи в Python / Pa...

1 ответ

Как хэшировать PySpark DataFrame, чтобы вернуть значение с плавающей точкой?

ТОП публикаций

1 ответ

Прочитайте из таблицы улья и запишите обратно, используя spark sql

Я читаю таблицу Hive, используя Spark SQL, и назначаю ее для scala val

1 ответ

Как фильтровать данные с помощью оконных функций в спарк

У меня есть следующие данные:

1 ответ

Извлечение различных значений в столбце с использованием Spark DataFrame

При использовании версии Spark 1.6.1 мне нужно получить различные значения в столбце, а затем выполнить какое-то конкретное преобразование поверх него. Столб...

1 ответ

Apache Spark Обработка перекошенных данных

У меня есть две таблицы, которые я хотел бы объединить. У одного из них очень плохой перекос данных. Это приводит к тому, что моя искровая работа не запускае...

1 ответ

Является ли запрос к Spark DataFrame на основе CSV быстрее, чем к Parquet?

1 ответ

Apache искра, имеющая дело с заявлениями случая

Я имею дело с преобразованием кода SQL в код PySpark и натолкнулся на некоторые операторы SQL. Я не знаю, как подойти к описанию случаев в pyspark? Я планиру...

1 ответ

Почему Apache Spark считывает ненужные столбцы Parquet во вложенных структурах?

Моя команда строит процесс ETL для загрузки необработанных текстовых файлов с разделителями в «озеро данных» на основе Parquet, используя Spark. Одно из обещ...