Результаты поиска по запросу "pyspark"

5 ответов

Как выполнить модульное тестирование программ PySpark?

Мой текущий подход к тестированию Java / Spark Unit работает (подробноВот) создание экземпляра SparkContext с использованием «local» и выполнение модульных т...

5 ответов

Как импортировать писпарк в анаконду

Я пытаюсь импортировать и использовать

1 ответ

Как вывести список RDD, определенных в оболочке Spark?

В оболочках «spark-shell» или «pyspark» я создал много RDD, но не смог найти какой-либо способ, с помощью которого я могу перечислить все доступные RDD в мое...

ТОП публикаций

1 ответ

SparkSQL: условная сумма с использованием двух столбцов

Я надеюсь, что вы можете помочь мне с этим. У меня есть DF следующим образом:

2 ответа

Подсчитать количество не-NaN записей в каждом столбце кадра данных Spark с Pyspark

У меня очень большой набор данных, загруженный в Hive. Он состоит из примерно 1,9 миллиона строк и 1450 столбцов. Мне нужно определить «охват» каждого из сто...

1 ответ

Как количество разделов влияет на `wholeTextFiles` и` textFiles`?

В искре я понимаю как пользоваться

0 ответов

Ошибка при печати RDD в Spark с Ipython

Я пытаюсь напечатать

2 ответа

Как загрузить jar-зависимости в IPython Notebook

Эта страница вдохновлял меня попробовать spark-csv для чтения .csv файла в PySpark, я нашел пару постов, таких какэтот описывающий как использоватьискровым C...

1 ответ

Как сохранить спарк-фрейм данных в виде текстового файла без строк в pyspark?

У меня есть фрейм данных "df" со столбцами ['name', 'age']. Я сохранил фрейм данных, используя

10 ответов

Как изменить имена столбцов данных в pyspark?

Я пришел из панды и привык к чтению данных из CSV-файлов в информационный фрейм, а затем просто изменяя имена столбцов на что-то полезное, используя простую ...