Результаты поиска по запросу "apache-spark"

9 ответов

Причина: ОШИБКА XSDB6: Возможно, другой экземпляр Derby уже загрузил базу данных.

Я пытаюсь запустить SparkSQL:

2 ответа

Создание бинарных гистограмм в Spark

Предположим, у меня есть фрейм данных (df) (Pandas) или RDD (Spark) со следующими двумя столбцами:

1 ответ

Настройка формул расстояния для K-средних в Apache Spark Python

Сейчас я использую K-средства для кластеризации и отслеживанияэтот урок а такжеAPI.Но я хочу использовать пользовательскую формулу для расчета расстояний. Ит...

ТОП публикаций

2 ответа

Как рассчитать медиану в искре sqlContext для столбца типа данных double

Я дал образец таблицы. Я хочу получить медиану из столбца «значение» для каждого столбца «источник» группы. Где столбец источника имеет значение типа String ...

2 ответа

Как преобразовать столбец WrappedArray в фрейме данных spark в строки?

Я пытаюсь преобразовать столбец, содержащий Array [String] в String, но я постоянно получаю эту ошибку

1 ответ

SparkR Job 100 минут ожидания

Я написал немного сложный скрипт sparkR и запустил его, используя spark-submit. То, что в основном делает скрипт, - это читать строку таблицы на основе больш...

1 ответ

Что означает «этап пропущен» в веб-интерфейсе Apache Spark?

Из моего интерфейса Spark. Что значит пропущенный?

4 ответа

Spark Dataframes UPSERT для таблицы Postgres

Я использую Apache Spark DataFrames, чтобы соединить два источника данных и получить результат как другой DataFrame. Я хочу записать результат в другую табли...

2 ответа

Как применить функцию к столбцу Spark DataFrame?

1 ответ

Почему мой Spark работает медленнее, чем чистый Python? Сравнение производительности