Результаты поиска по запросу "apache-spark"

1 ответ

Кеширование промежуточных результатов в конвейере Spark ML

В последнее время я планирую перенести мой автономный код Python ML для запуска. Трубопровод ML в

2 ответа

Как разделить по ключу в Spark?

Учитывая, что документы HashPartitioner говорят:[HashPartitioner] реализует разбиение на основе хеша с использованием Java Object.hashCode.Скажи, я хочу раздел

0 ответов

Как настроить Zeppelin для работы с удаленным кластером EMR Yarn

ТОП публикаций

1 ответ

Передача функций класса в PySpark RDD

У меня есть класс с именем some_class () в файле Python:

1 ответ

SparkSQL - функция задержки?

Я вижу в этомПост DataBricksВ SparkSql есть поддержка оконных функций, в частности я пытаюсь использовать оконную функцию lag ().У меня есть строки транзакци...

3 ответа

Каков наилучший способ определения пользовательских методов в DataFrame?

1 ответ

Spark MLlib LDA, как вывести темы распространения нового невидимого документа?

Я заинтересован в применении тематического моделирования LDA с использованием Spark MLlib. Я проверил код и объяснения вВот но я не мог найти, как использова...

2 ответа

Как использовать SQL-запрос для определения таблицы в dbtable?

ВJDBC в другие базы данных Я нашел следующее объяснение

1 ответ

Spark ML Трубопроводная логистическая регрессия дает гораздо худшие прогнозы, чем R GLM

Я использовал ML PipeLine для запуска моделей логистической регрессии, но по некоторым причинам я получил худшие результаты, чем R. Я провел некоторые исслед...

2 ответа

Будет ли Spark бездействовать сам RDD, когда он поймет, что он больше не будет использоваться?

Мы можем сохранить СДР в памяти и / или на диске, когда хотим использовать его более одного раза. Тем не менее, нужно ли нам в дальнейшем самим отменять это,...