Результаты поиска по запросу "spark-dataframe"

4 ответа

Обновление столбца данных в спарк

Глядя на новый API-интерфейс Spark Dataframe, неясно, можно ли изменить столбцы DataFrame.Как бы я изменил значение в строке

5 ответов

Сохранить Spark DataFrame как динамическую многораздельную таблицу в Hive

У меня есть пример приложения, работающего для чтения из файлов CSV в кадре данных. Фрейм данных может быть сохранен в таблице Hive в формате паркета, исполь...

3 ответа

Что является эффективным, Dataframe или RDD или hiveql?

Я новичок в Apache Spark.Моя задача - прочитать два CSV-файла, выбрать из него несколько определенных столбцов, объединить их, объединить и записать результа...

ТОП публикаций

0 ответов

SparkR collect () и head () для Spark DataFrame: аргументы подразумевают различное количество строк

1 ответ

СПАРК Является ли метод выборки на Датафреймах равномерной выборкой?

Я хочу произвольно выбрать число строк в кадре данных и знаю, что метод выборки делает это, но я обеспокоен тем, что моя случайность должна быть равномерной ...

1 ответ

Spark DataFrames Groupby в список

Я пытаюсь сделать некоторый анализ на множествах. У меня есть пример набора данных, который выглядит следующим образом:orders.json

2 ответа

Как повысить производительность медленных заданий Spark с использованием соединения DataFrame и JDBC?

1 ответ

Как отфильтровать один искровой фрейм данных против другого фрейма данных

3 ответа

Преобразование RDD [org.apache.spark.sql.Row] в RDD [org.apache.spark.mllib.linalg.Vector]

9 ответов

Лучший способ получить максимальное значение в столбце данных Spark