Результаты поиска по запросу "pyspark"

У меня есть кластер на AWS с 2 рабами и 1 мастером. Все экземпляры имеют тип m1.large. У меня работает спарк версии 1.4. Я оцениваю производительность на 4 м...

apache-spark-sql regex apache-spark dataframe

1 ответ

Функция Strip или Regex в кадре данных Spark 1.3

У меня есть некоторый код из PySpark 1.5, который я, к сожалению, должен перенести обратно в Spark 1.3. У меня есть столбец с алфавитно-цифровыми элементами,...

apache-spark jvm-arguments

1 ответ

Укажите параметры для jvm, запущенного pyspark

ТОП публикаций

10 Food Delivery Startups to Watch for in 2020

7 Best Telemedicine Apps In 2020

How to Build a Live Streaming Video App and Reach Founder’s Zen

19 Tools And Resources to Build an MVP From Scratch

python rdd apache-spark

2 ответа

Возврат RDD с наибольшим значением N из другого RDD в SPARK

Я пытаюсь отфильтровать RDD кортежей, чтобы получить наибольшее N кортежей на основе значений ключей. Мне нужен формат возврата, чтобы быть RDD.Итак, СДР:

python apache-spark case-class

2 ответа

Что такое эквивалентный класс случая Scala в PySpark?

Как бы вы применили и / или внедрили эквивалент класса case в PySpark?

apache-spark apache-spark-sql

3 ответа

С UDF с помощью взрыва

с Я хочу добавить возвращаемые значения UDF к существующему фрейму данных в отдельных столбцах. Как мне достичь этого изобретательно? Вот пример того, что я имею до сих пор. from pyspark.sql.functions import udf from pyspark.sql.types import ...

python spark-dataframe apache-spark-sql apache-spark

9 ответов

Лучший способ получить максимальное значение в столбце данных Spark

rdd python bigdata apache-spark

2 ответа

PySpark DataFrames - способ перечисления без преобразования в панды?

У меня очень большойpyspark.sql.dataframe.DataFrame по имени дф. Мне нужен какой-то способ перечисления записей - таким образом, возможность доступа к записи...

yarn amazon-ec2 apache-spark

3 ответа