Результаты поиска по запросу "parquet"

Я пытаюсь преобразовать удаленную таблицу MySQL в файл паркета, используя spark 1.6.2.Процесс выполняется в течение 10 минут, заполняя память, затем начинает...

scala java avro

2 ответа

Как читать и писать Map <String, Object> из / в паркетный файл на Java или Scala?

Ищете краткий пример о том, как читать и писать

ТОП публикаций

Test Test Test Test Test Test

21 Startup Ideas to Start Profitable Business in 2020

How To Build E-Learning Platform From Scratch: The Complex Guide From Idea to MVP

How to Raise Your Own SaaS Product off the Ground and Avoid Common Pitfalls

hdfs hadoop avro file

3 ответа

Каковы плюсы и минусы формата паркета по сравнению с другими форматами?

pandas pyarrow python

3 ответа

Выход:

ы добавляете / обновляетеparquet файл сpyarrow? import pandas as pd import pyarrow as pa import pyarrow.parquet as pq table2 = pd.DataFrame({'one': [-1, np.nan, 2.5], 'two': ['foo', 'bar', 'baz'], 'three': [True, False, True]}) table3 = ...

avro hive

1 ответ

Создать таблицу Hive для чтения файлов паркета из схемы parquet / avro

hadoop sql-server mysql

2 ответа

Как преобразовать таблицу SQL объемом 500 ГБ в Apache Parquet?

Возможно, это хорошо задокументировано, но я очень запутался, как это сделать (есть много инструментов Apache).Когда я создаю таблицу SQL, я создаю таблицу, ...

storage apache-spark aggregation

1 ответ

Почему файлы Spark Parquet для агрегата больше исходного?

Я пытаюсь создать сводный файл для конечных пользователей, чтобы они не обрабатывали несколько источников с файлами большего размера. Для этого я: A) перебир...

amazon-s3 aws-lambda python pyarrow

2 ответа

@Ptah, можешь поделиться, как ты разрешил лямбда-сервису доступ к S3?

аюсь загрузить, обработать и записать файлы Parquet в S3 с помощью AWS Lambda. Мой процесс тестирования / развертывания: https://github.com/lambci/docker-lambda [https://github.com/lambci/docker-lambda]в качестве контейнера для макета ...

scala apache-spark

1 ответ

режим, каждый рабочий поток должен работать независимо от других, не так ли?

аписанииdataframe вparquet с помощьюpartitionBy : df.write.partitionBy("col1","col2","col3").parquet(path)Я ожидал бы, что каждый записываемый раздел выполнялся независимо отдельной задачей и параллельно количеству работников, назначенных на ...

Страница 1 из 4

12 3 4

Результаты поиска по запросу "parquet"

Авро против Паркет

Искра Исключение при преобразовании таблицы MySQL в паркет

Как читать и писать Map <String, Object> из / в паркетный файл на Java или Scala?

Популярные теги

ТОП публикаций

Каковы плюсы и минусы формата паркета по сравнению с другими форматами?

Выход:

Создать таблицу Hive для чтения файлов паркета из схемы parquet / avro

Как преобразовать таблицу SQL объемом 500 ГБ в Apache Parquet?

Почему файлы Spark Parquet для агрегата больше исходного?

@Ptah, можешь поделиться, как ты разрешил лямбда-сервису доступ к S3?

режим, каждый рабочий поток должен работать независимо от других, не так ли?

Вы очень активны! Это здорово!

Результаты поиска по запросу "parquet"

Популярные теги

ТОП публикаций