Результаты поиска по запросу "parquet"

Я попытался использовать Apache-Drill для выполнения простого запроса объединения-объединения, и скорость была не очень хорошей. мой тестовый запрос был:

spark-dataframe apache-spark

1 ответ

Почему Apache Spark считывает ненужные столбцы Parquet во вложенных структурах?

Моя команда строит процесс ETL для загрузки необработанных текстовых файлов с разделителями в «озеро данных» на основе Parquet, используя Spark. Одно из обещ...

ТОП публикаций

Test Test Test Test Test Test

21 Startup Ideas to Start Profitable Business in 2020

How To Build E-Learning Platform From Scratch: The Complex Guide From Idea to MVP

How to Raise Your Own SaaS Product off the Ground and Avoid Common Pitfalls

apache-spark

1 ответ

Быстрый Паркетный ряд в Spark

Файлы Parquet содержат поле количества строк для каждого блока. Спарк, кажется, читает это в какой-то момент (

amazon-s3 emr bigdata amazon-emr

1 ответ

Как избежать чтения старых файлов из S3 при добавлении новых данных?

Раз в 2 часа запускается работа spark для преобразования некоторых файлов tgz в паркет. Задание добавляет новые данные в существующий паркет в s3:

hadoop sql-server mysql

2 ответа

Как преобразовать таблицу SQL объемом 500 ГБ в Apache Parquet?

Возможно, это хорошо задокументировано, но я очень запутался, как это сделать (есть много инструментов Apache).Когда я создаю таблицу SQL, я создаю таблицу, ...

apache-spark apache-spark-sql

1 ответ

Искра Исключение при преобразовании таблицы MySQL в паркет

Я пытаюсь преобразовать удаленную таблицу MySQL в файл паркета, используя spark 1.6.2.Процесс выполняется в течение 10 минут, заполняя память, затем начинает...

data-formats hadoop apache-drill java

1 ответ

Но в нашем случае ParquetWriter имеет только абстрактный конструктор.

ал решение этого вопроса.Мне кажется, что нет способа встроить чтение и запись формата Parquet в Java-программу без учета зависимостей от HDFS и Hadoop. Это ...

datetime apache-spark

1 ответ

Вы должны получить все необходимые данные.

вы создаете столбец временной метки в spark и сохраняете его в паркет, вы получаете 12-байтовый целочисленный тип столбца (int96); Я собираю данные разбиты н...

apache-spark scala

1 ответ

аюсь прочитать файлы, присутствующие наSequence троп в скале. Ниже приведен пример (псевдо) кода: val paths = Seq[String] //Seq of paths val dataframe = spark.read.parquet(paths: _*)Теперь в приведенной выше последовательности некоторые пути ...

Страница 3 из 4

1 234

Результаты поиска по запросу "parquet"

Является ли запрос к Spark DataFrame на основе CSV быстрее, чем к Parquet?

Apache Drill плохая производительность

Почему Apache Spark считывает ненужные столбцы Parquet во вложенных структурах?

Популярные теги

ТОП публикаций

Быстрый Паркетный ряд в Spark

Как избежать чтения старых файлов из S3 при добавлении новых данных?

Как преобразовать таблицу SQL объемом 500 ГБ в Apache Parquet?

Искра Исключение при преобразовании таблицы MySQL в паркет

Но в нашем случае ParquetWriter имеет только абстрактный конструктор.

Вы должны получить все необходимые данные.

этот ответ

Вы очень активны! Это здорово!

Результаты поиска по запросу "parquet"

Популярные теги

ТОП публикаций