Результаты поиска по запросу "parquet"

Если у меня есть файл двоичных данных (он может быть преобразован в формат CSV), есть ли способ загрузить таблицу паркет непосредственно из него? Многие учеб...

apache-spark-sql amazon-s3 apache-spark hadoop

1 ответ

Spark SQL не может завершить запись данных Parquet с большим количеством фрагментов

Я пытаюсь использовать Apache Spark SQL для преобразования данных журнала JSON на S3 в файлы Parquet также на S3. Мой код в основном:

ТОП публикаций

Test Test Test Test Test Test

21 Startup Ideas to Start Profitable Business in 2020

How To Build E-Learning Platform From Scratch: The Complex Guide From Idea to MVP

How to Raise Your Own SaaS Product off the Ground and Avoid Common Pitfalls

apache-spark-sql apache-spark java hadoop

5 ответов

Искра Исключение: не удалось выполнить задачу при записи строк

Я читаю текстовые файлы и преобразовываю их в паркетные файлы. Я делаю это с использованием искрового кода. Но когда я пытаюсь запустить код, я получаю следу...

storage apache-spark aggregation

1 ответ

Почему файлы Spark Parquet для агрегата больше исходного?

Я пытаюсь создать сводный файл для конечных пользователей, чтобы они не обрабатывали несколько источников с файлами большего размера. Для этого я: A) перебир...

hadoop avro

7 ответов

Как конвертировать искры SchemaRDD в RDD моего класса case?

В документах spark ясно, как создавать паркетные файлы из

append apache-spark scala

2 ответа

Добавлять новые данные в разделенные файлы паркета

Я пишу ETL-процесс, в котором мне нужно будет почитать почасовые журналы, разделить данные и сохранить их. Я использую Spark (в Databricks). Файлы журналов C...

pandas pyarrow python

3 ответа

ы добавляете / обновляетеparquet файл сpyarrow? import pandas as pd import pyarrow as pa import pyarrow.parquet as pq table2 = pd.DataFrame({'one': [-1, np.nan, 2.5], 'two': ['foo', 'bar', 'baz'], 'three': [True, False, True]}) table3 = ...

pandas blaze python

2 ответа

Как прочитать файл Parquet в Pandas DataFrame?

Как прочитать набор данных Parquet небольшого размера в оперативную память Pandas DataFrame, не настраивая инфраструктуру кластерных вычислений, такую как ...

Страница 1 из 4

12 3 4

Результаты поиска по запросу "parquet"

Каковы плюсы и минусы формата паркета по сравнению с другими форматами?

Можно ли загрузить паркетный стол прямо из файла?

Spark SQL не может завершить запись данных Parquet с большим количеством фрагментов

Популярные теги

ТОП публикаций

Искра Исключение: не удалось выполнить задачу при записи строк

Почему файлы Spark Parquet для агрегата больше исходного?

Авро против Паркет

Как конвертировать искры SchemaRDD в RDD моего класса case?

Добавлять новые данные в разделенные файлы паркета

Выход:

Как прочитать файл Parquet в Pandas DataFrame?

Вы очень активны! Это здорово!

Результаты поиска по запросу "parquet"

Популярные теги

ТОП публикаций