Результаты поиска по запросу "apache-spark"

2 ответа

Не могу импортировать sqlContext.implicits._ без ошибки через Jupyter

Когда я пытаюсь использовать

1 ответ

Умножение искровой матрицы на питон

Я пытаюсь сделать матричное умножение, используя Apache Spark и Python.Вот мои данные

1 ответ

Как получить Precision / Recall с использованием CrossValidator для обучения модели NaiveBayes с использованием Spark

Предполагается, что у меня есть такой конвейер:

ТОП публикаций

1 ответ

Как зарегистрировать байт [] [], используя сериализацию kryo для искры

Я пытаюсь полностью использовать сериализацию крио для искры. настройка

4 ответа

Переименуйте поворотный и агрегированный столбец в PySpark Dataframe

С фреймом данных следующим образом:

1 ответ

Почему rdd.map (identity) .cache работает медленно, когда rdd-элементы велики?

Я узнал, что при использовании

1 ответ

SparkStreaming, RabbitMQ и MQTT в Python с использованием Пика

Просто чтобы усложнить задачу, я бы хотел получать сообщения из очереди rabbitMQ. Теперь я знаю, что есть плагин для MQTT на кролика (https://www.rabbitmq.co...

2 ответа

Что такое оптимизированный способ объединения больших таблиц в Spark SQL

Мне нужно объединить таблицы с помощью Spark SQL или Dataframe API. Нужно знать, каким будет оптимизированный способ его достижения.Сценарий это:Все данные п...

6 ответов

Транспонировать столбец в ряд с помощью Spark

Я пытаюсь переместить некоторые столбцы моей таблицы в строку. Я использую Python и Spark 1.5.0. Вот моя начальная таблица:

3 ответа

Spark java.lang.StackOverflowError

Я использую спарк, чтобы вычислить рейтинг страниц отзывов пользователей, но я продолжаю получать Spark