Результаты поиска по запросу "apache-spark"
Не могу импортировать sqlContext.implicits._ без ошибки через Jupyter
Когда я пытаюсь использовать
Умножение искровой матрицы на питон
Я пытаюсь сделать матричное умножение, используя Apache Spark и Python.Вот мои данные
Как получить Precision / Recall с использованием CrossValidator для обучения модели NaiveBayes с использованием Spark
Предполагается, что у меня есть такой конвейер:
Как зарегистрировать байт [] [], используя сериализацию kryo для искры
Я пытаюсь полностью использовать сериализацию крио для искры. настройка
Переименуйте поворотный и агрегированный столбец в PySpark Dataframe
С фреймом данных следующим образом:
Почему rdd.map (identity) .cache работает медленно, когда rdd-элементы велики?
Я узнал, что при использовании
SparkStreaming, RabbitMQ и MQTT в Python с использованием Пика
Просто чтобы усложнить задачу, я бы хотел получать сообщения из очереди rabbitMQ. Теперь я знаю, что есть плагин для MQTT на кролика (https://www.rabbitmq.co...
Что такое оптимизированный способ объединения больших таблиц в Spark SQL
Мне нужно объединить таблицы с помощью Spark SQL или Dataframe API. Нужно знать, каким будет оптимизированный способ его достижения.Сценарий это:Все данные п...
Транспонировать столбец в ряд с помощью Spark
Я пытаюсь переместить некоторые столбцы моей таблицы в строку. Я использую Python и Spark 1.5.0. Вот моя начальная таблица:
Spark java.lang.StackOverflowError
Я использую спарк, чтобы вычислить рейтинг страниц отзывов пользователей, но я продолжаю получать Spark