Результаты поиска по запросу "apache-spark"

3 ответа

Разница между фильтром и где в scala spark sql

Я пробовал оба, но работает одинаковопример

0 ответов

Ошибка при печати RDD в Spark с Ipython

Я пытаюсь напечатать

2 ответа

Авро Схема для зажигания StructType

Это фактически так же, как мойпредыдущий вопрос, но используя Avro, а не JSON в качестве формата данных.Я работаю с фреймом данных Spark, который может загру...

ТОП публикаций

2 ответа

Как загрузить jar-зависимости в IPython Notebook

Эта страница вдохновлял меня попробовать spark-csv для чтения .csv файла в PySpark, я нашел пару постов, таких какэтот описывающий как использоватьискровым C...

2 ответа

Подсчитать количество не-NaN записей в каждом столбце кадра данных Spark с Pyspark

У меня очень большой набор данных, загруженный в Hive. Он состоит из примерно 1,9 миллиона строк и 1450 столбцов. Мне нужно определить «охват» каждого из сто...

1 ответ

Лямбда-выражения не поддерживаются на этом уровне языка [дубликаты]

На этот вопрос уже есть ответ здесь:Java «лямбда-выражения не поддерживаются на этом уровне языка» 23 ответаУ меня есть класс Java, который использует Spark....

2 ответа

Как определить пользовательскую функцию агрегирования для суммирования столбца Векторов?

У меня есть DataFrame из двух столбцов,

1 ответ

Как количество разделов влияет на `wholeTextFiles` и` textFiles`?

В искре я понимаю как пользоваться

1 ответ

Почему Yarn на EMR не выделяет все узлы для выполнения заданий Spark?

Я работаю над Apache Spark на Amazon Elastic Map Reduce (EMR). В настоящее время я работаю на emr-4.1.0, который включает Amazon Hadoop 2.6.0 и Spark 1.5.0.К...

1 ответ

Кто может дать четкое объяснение `ОбъединитьByKey` в Spark?

я учусь искру, но я не могу понять эту функцию