Результаты поиска по запросу "apache-spark-sql"

1 ответ

Как эффективен способ разделения на столбцы, но с фиксированным количеством разделов?

Каков наилучший способ разбить данные по полю на предопределенное количество разделов?В настоящее время я делю данные, указав partionCount = 600. Найдено, чт...

1 ответ

Чтение нескольких файлов из S3 в Spark по периоду даты

ОписаниеУ меня есть приложение, которое отправляет данные в AWS Kinesis Firehose, и оно записывает данные в мое хранилище S3. Firehose использует формат «ггг...

4 ответа

Как сгладить структуру в кадре данных Spark?

У меня есть датафрейм со следующей структурой:

ТОП публикаций

1 ответ

Прочитайте из таблицы улья и запишите обратно, используя spark sql

Я читаю таблицу Hive, используя Spark SQL, и назначаю ее для scala val

2 ответа

argmax в Spark DataFrames: как получить строку с максимальным значением

Учитывая Spark DataFrame

1 ответ

Влияние на производительность RDD API по сравнению с UDF, смешанными с DataFrame API

1 ответ

Искра - ВЫБЕРИТЕ ГДЕ или фильтруете?

В чем разница между выбором с предложением where и фильтрацией в Spark?Есть ли случаи использования, в которых один более подходит, чем другой?Когда я использую

1 ответ

Извлечение различных значений в столбце с использованием Spark DataFrame

При использовании версии Spark 1.6.1 мне нужно получить различные значения в столбце, а затем выполнить какое-то конкретное преобразование поверх него. Столб...

1 ответ

Почему SparkSession выполняется дважды за одно действие?

Недавно обновлен до Spark 2.0, и я вижу странное поведение при попытке создать простой набор данных из строк JSON. Вот простой тестовый пример:

3 ответа

Как преобразовать столбец массивов строк в строки?

У меня есть столбец, который имеет тип