Результаты поиска по запросу "rdd"

6 ответов

Инициализировать RDD для очистки

У меня есть RDD под названием

2 ответа

Количество разделов в RDD и производительность в Spark

В Pyspark я могу создать RDD из списка и решить, сколько разделов иметь:

3 ответа

Как рассчитать лучшее количество разделений для объединения?

Итак, я понимаю, что в целом следует использовать

ТОП публикаций

3 ответа

Как разделить Spark RDD между двумя контекстами Spark?

3 ответа

Является ли groupByKey когда-либо предпочтительнее

0 ответов

 и уверен, что вы знаете, что делаете при изменении кода: ваше редактирование испортило совершенно хороший ответ, в результате чего возникло исключение (восстановленное в оригинале OP) ...

я есть фрейм данных со следующим типом col1|col2|col3|col4 xxxx|yyyy|zzzz|[1111],[2222]Я хочу, чтобы мой вывод был следующего типа col1|col2|col3|col4|col5 xxxx|yyyy|zzzz|1111|2222Мой col4 является массивом, и я хочу преобразовать его в ...

4 ответа

Как найти медиану и квантили с помощью Spark

1 ответ

этот ответ

я есть следующие данные в фрейме данных pyspark под названиемend_stats_df: values start end cat1 cat2 10 1 2 A B 11 1 2 C B 12 1 2 D B 510 1 2 D C 550 1 2 C B 500 1 2 A B 80 1 3 A BИ я хочу агрегировать это следующим образом: Я хочу ...

2 ответа

Как работает DAG под чехлами в RDD?

Spark исследовательская работа предписал новую модель распределенного программирования по сравнению с классическим Hadoop MapReduce, заявляя об упрощении и з...

3 ответа

Привет, я разместил свое решение. :)

жил JSON и хотел бы иметь вывод в табличной структуре. Я могу анализировать значения JSON по отдельности, но у меня возникли некоторые проблемы с его табулир...