Результаты поиска по запросу "pyspark"

1 ответ

Почему мой Spark работает медленнее, чем чистый Python? Сравнение производительности

1 ответ

Как я могу разделить pyspark RDD с функциями R

11 ответов

Как связать PyCharm с PySpark?

ТОП публикаций

4 ответа

Как рассчитать накопительную сумму, используя sqlContext

Я знаю, что мы можем использоватьОконная функция в писпарке рассчитать накопленную сумму. Но Window поддерживается только в HiveContext, а не в SQLContext. М...

3 ответа

UDF Pyspark DataFrame в текстовом столбце

Я пытаюсь очистить некоторые тексты НЛП от некоторых столбцов Unicode в PySpark DataFrame. Я пробовал в Spark 1.3, 1.5 и 1.6 и, похоже, не могу заставить вещ...

2 ответа

Spark Выполнение файла TB в памяти

Предположим, у меня есть один файл данных Tb. Объем памяти каждого узла в кластере из 10 узлов составляет 3 ГБ.Я хочу обработать файл, используя спарк. Но ка...

1 ответ

Функция Strip или Regex в кадре данных Spark 1.3

У меня есть некоторый код из PySpark 1.5, который я, к сожалению, должен перенести обратно в Spark 1.3. У меня есть столбец с алфавитно-цифровыми элементами,...

3 ответа

Когда вы отправляете задание с помощью pyspark, как получить доступ к загрузке статических файлов с аргументом --files?

например, у меня есть папка:

1 ответ

Создать DataFrame из списка кортежей, используя pyspark

1 ответ

Переполнение стека при обработке нескольких столбцов с помощью UDF

у меня есть