Результаты поиска по запросу "parquet"

1 ответ

Спарк раздел намного медленнее чем без него

Я проверил написание с:

2 ответа

Как прочитать файл Parquet в Pandas DataFrame?

Как прочитать набор данных Parquet небольшого размера в оперативную память Pandas DataFrame, не настраивая инфраструктуру кластерных вычислений, такую ​​как ...

1 ответ

Создать таблицу Hive для чтения файлов паркета из схемы parquet / avro

ТОП публикаций

1 ответ

Spark SQL - загрузка файлов CSV / PSV с некоторыми искаженными записями

2 ответа

Добавлять новые данные в разделенные файлы паркета

Я пишу ETL-процесс, в котором мне нужно будет почитать почасовые журналы, разделить данные и сохранить их. Я использую Spark (в Databricks). Файлы журналов C...

5 ответов

Искра Исключение: не удалось выполнить задачу при записи строк

Я читаю текстовые файлы и преобразовываю их в паркетные файлы. Я делаю это с использованием искрового кода. Но когда я пытаюсь запустить код, я получаю следу...

3 ответа

Каковы плюсы и минусы формата паркета по сравнению с другими форматами?

2 ответа

Использование Spark для записи файла паркета в s3 поверх s3a очень медленное

1 ответ

Почему файлы Spark Parquet для агрегата больше исходного?

Я пытаюсь создать сводный файл для конечных пользователей, чтобы они не обрабатывали несколько источников с файлами большего размера. Для этого я: A) перебир...

2 ответа

Как добавить данные в существующий файл паркета