Результаты поиска по запросу "parquet"

Как бороться с задачами, выполняющимися слишком долго (по сравнению с другими в работе) в Yarn-клиенте?

Как прочитать файл Parquet в Pandas DataFrame?

Как прочитать набор данных Parquet небольшого размера в оперативную память Pandas DataFrame, не настраивая инфраструктуру кластерных вычислений, такую как ...

append apache-spark scala

2 ответа

Добавлять новые данные в разделенные файлы паркета

Я пишу ETL-процесс, в котором мне нужно будет почитать почасовые журналы, разделить данные и сохранить их. Я использую Spark (в Databricks). Файлы журналов C...

ТОП публикаций

How to write controller in Odoo 12

EHR Software Development: What you need to know [SPDLoad Full Guide]

Любимый шрифт свинки Пеппы и как его сделать

10 Food Delivery Startups to Watch for in 2020

apache-spark scala apache-spark-sql amazon-s3

2 ответа

Использование Spark для записи файла паркета в s3 поверх s3a очень медленное

hadoop java

2 ответа

Как добавить данные в существующий файл паркета

performance apache-drill

2 ответа

Apache Drill плохая производительность

Я попытался использовать Apache-Drill для выполнения простого запроса объединения-объединения, и скорость была не очень хорошей. мой тестовый запрос был:

hadoop sql-server mysql

2 ответа

Как преобразовать таблицу SQL объемом 500 ГБ в Apache Parquet?

Возможно, это хорошо задокументировано, но я очень запутался, как это сделать (есть много инструментов Apache).Когда я создаю таблицу SQL, я создаю таблицу, ...

amazon-s3 aws-lambda python pyarrow

2 ответа

@Ptah, можешь поделиться, как ты разрешил лямбда-сервису доступ к S3?

аюсь загрузить, обработать и записать файлы Parquet в S3 с помощью AWS Lambda. Мой процесс тестирования / развертывания: https://github.com/lambci/docker-lambda [https://github.com/lambci/docker-lambda]в качестве контейнера для макета ...

hdfs hadoop avro file

3 ответа

Каковы плюсы и минусы формата паркета по сравнению с другими форматами?

pandas pyarrow python

3 ответа

Выход:

ы добавляете / обновляетеparquet файл сpyarrow? import pandas as pd import pyarrow as pa import pyarrow.parquet as pq table2 = pd.DataFrame({'one': [-1, np.nan, 2.5], 'two': ['foo', 'bar', 'baz'], 'three': [True, False, True]}) table3 = ...

Страница 3 из 4

1 234

Вы очень активны! Это здорово!

Результаты поиска по запросу "parquet"

Популярные теги

ТОП публикаций