Результаты поиска по запросу "pyspark"

1 ответ

Использование графических фреймов с PyCharm

Я потратил почти 2 дня на прокрутку интернета и не смог разобраться с этой проблемой. Я пытаюсь установитьпакет графических фреймов (Версия: 0.2.0-spark2.0-s...

1 ответ

Spark: Как уменьшить «ByByKey», когда ключи являются массивами, которые не могут быть хэшируемыми?

У меня есть RDD (ключ, значение) элементов. Ключи - это массивы NumPy. Массивы NumPy не являются хэшируемыми, и это вызывает проблему, когда я пытаюсь

2 ответа

Как сохранить / вставить каждый DStream в постоянную таблицу

Я столкнулся с проблемой с «Spark Streaming» о вставке выходного Dstream впостоянный Таблица SQL. Я хотел бы вставить каждый выходной DStream (исходящий из о...

ТОП публикаций

2 ответа

Spark RDD для DataFrame Python

Я пытаюсь преобразовать Spark RDD в DataFrame. Я видел документацию и пример, где схема передается

1 ответ

Spark загрузить данные и добавить имя файла в виде столбца данных

Я загружаю некоторые данные в Spark с помощью функции-оболочки:

1 ответ

Как Spark работает на учетной записи YARN для использования памяти Python?

После прочтения документации я не понимаю, как Spark работает на YARN-аккаунте для потребления памяти Python.Считается ли это в сторону

1 ответ

PySpark: StructField (…,…, False) всегда возвращает «nullable = true» вместо «nullable = false»

Я новичок в PySpark и сталкиваюсь со странной проблемой. Я пытаюсь установить для некоторого столбца ненулевое значение при загрузке набора данных CSV. Я мог...

1 ответ

Spark RDD: Как наиболее эффективно рассчитать статистику?

Предполагая существование RDD кортежей, подобных следующему:

3 ответа

Применение пользовательских функций к GroupedData в PySpark (с примером работающего Python)

У меня есть этот код Python, который запускается локально в кадре данных панд:

3 ответа

Как запустить скрипт в PySpark