Результаты поиска по запросу "apache-spark"

5 ответов

Почему PySpark не может найти py4j.java_gateway?

5 ответов

TaskSchedulerImpl: начальное задание не приняло никаких ресурсов;

4 ответа

Как передать переменные среды в драйвер spark в режиме кластера с помощью spark-submit

ТОП публикаций

1 ответ

драйвер искры не найден

Я пытаюсь записать dataframe в sqlserver с помощью spark. Я использую метод записи для dataframewriter для записи на сервер SQL. Используя DriverManager.getC...

1 ответ

и извлечь:

чномstructured_kafka_wordcount.py [https://gist.github.com/hrchu/2b2590f2f737ef430ac32b7f8edc15c0]код, Когда я делю строки на словаudf как ниже, my_split = udf(lambda x: x.split(' '), ArrayType(StringType())) words = lines.select( explode( ...

1 ответ

Почему в Apache Spark RDD.union не сохраняет разделитель?

Как всем известно, разделители в Spark оказывают огромное влияние на производительность любых «широких» операций, поэтому обычно они настраиваются в операция...

4 ответа

Pyspark и PCA: как я могу извлечь собственные векторы этого PCA? Как я могу рассчитать, сколько дисперсии они объясняют?

Я уменьшаю размерность

3 ответа

Spark: увеличить количество разделов, не вызывая перемешивания?

2 ответа

В Spark 2.0 отсутствуют искровые последствия

Используя Spark 2.0, я увидел, что можно превратить данные в строках в классы дел. Когда я пытаюсь это сделать, меня приветствует сообщение об импорте

3 ответа

Вставка аналитических данных из Spark в Postgres

У меня есть база данных Cassandra, из которой я анализировал данные, используя SparkSQL через Apache Spark. Теперь я хочу вставить эти проанализированные дан...