Resultados da pesquisa a pedido "orc"

5 a resposta

Parquet vs ORC vs ORC com Snappy

Estou executando alguns testes nos formatos de armazenamento disponíveis no Hive e usando o Parquet e o ORC como principais opções. Incluí o ORC uma vez com a compactação padrão e outra com o Snappy. Eu li muitos documentos que afirmam que o ...

2 a resposta

Como combinar ou mesclar arquivos ORC pequenos em um arquivo ORC maior?

A maioria das perguntas / respostas no SO e na web discutem o uso do Hive para combinar vários arquivos ORC pequenos em um maior, no entanto, meus arquivos ORC são arquivos de log separados por dia e preciso mantê-los separados. Eu só ...

2 a resposta

Arquivo Hadoop ORC - Como funciona - Como buscar metadados

Eu sou novo no arquivo ORC. Passei por muitos blogs, mas não obtive um entendimento claro. Ajude e esclareça as perguntas abaixo. Posso buscar o esquema do arquivo ORC? Eu sei que no Avro, o esquema pode ser buscado. Como ele realmente fornece ...

4 a resposta

Agregando várias colunas com função personalizada no Spark

Fiquei me perguntando se existe alguma maneira de especificar uma função de agregação personalizada para quadros de dados spark em várias colunas. Eu tenho uma tabela como esta do tipo (nome, item, preço): john | tomato | 1.99 john | carrot | ...