Результаты поиска по запросу "apache-spark"

1 ответ

Как Spark достигает параллелизма в рамках одной задачи на многоядерных или гиперпоточных машинах

Я читал и пытался понять, как Spark Framework использует свои ядра вStandalone Режим. Согласно документации Spark, параметр "spark.task.cpusЗначение по ...

2 ответа

Я бы сказал, что вам нужно запустить UDF, где вы можете применить логику для преобразования массива в строку, а затем выбрать новый столбец

1 ответ

как вы создаете sqlContext?

ускаю модуль логистической регрессии в Scala, и у меня есть кадр данных, как показано ниже: Д.Ф. +-----------+------------+ |x |y | +-----------+------------+ | 0| 0| | 0| 33| | 0| 58| | 0| 96| | 0| 1| | 1| 21| | 0| 10| | 0| 65| | 1| 7| | 1| ...

ТОП публикаций

2 ответа

Искровая ошибка: ожидаемые нулевые аргументы для построения ClassDict (для numpy.core.multiarray._reconstruct)

У меня есть датафрейм в Spark, в котором один из столбцов содержит массив. Теперь я написал отдельный UDF, который преобразует массив в другой массив только ...

1 ответ

Как удалить столбцы в фрейме pyspark

1 ответ

Ресурсы / Документация о том, как работает процесс аварийного переключения для драйвера Spark (и его контейнера YARN) в режиме кластера пряжи

1 ответ

Spark 2.0.0 Arrays.asList не работает - несовместимые типы

Следующий код работает со Spark 1.5.2, но не со Spark 2.0.0. Я использую Java 1.8.

2 ответа

Scala Spark: разбить коллекцию на несколько RDD?

Есть ли какая-либо функция Spark, которая позволяет разбить коллекцию на несколько RDD в соответствии с некоторыми вариантами? Такая функция позволила бы изб...

3 ответа

Преобразование RDD [org.apache.spark.sql.Row] в RDD [org.apache.spark.mllib.linalg.Vector]

5 ответов

Доступ к HDFS HA ​​из искрового задания (ошибка UnknownHostException)