Resultados da pesquisa a pedido "orc"
Parquet vs ORC vs ORC com Snappy
Estou executando alguns testes nos formatos de armazenamento disponíveis no Hive e usando o Parquet e o ORC como principais opções. Incluí o ORC uma vez com a compactação padrão e outra com o Snappy. Eu li muitos documentos que afirmam que o ...
Agregando várias colunas com função personalizada no Spark
Fiquei me perguntando se existe alguma maneira de especificar uma função de agregação personalizada para quadros de dados spark em várias colunas. Eu tenho uma tabela como esta do tipo (nome, item, preço): john | tomato | 1.99 john | carrot | ...
Arquivo Hadoop ORC - Como funciona - Como buscar metadados
Eu sou novo no arquivo ORC. Passei por muitos blogs, mas não obtive um entendimento claro. Ajude e esclareça as perguntas abaixo. Posso buscar o esquema do arquivo ORC? Eu sei que no Avro, o esquema pode ser buscado. Como ele realmente fornece ...
Como combinar ou mesclar arquivos ORC pequenos em um arquivo ORC maior?
A maioria das perguntas / respostas no SO e na web discutem o uso do Hive para combinar vários arquivos ORC pequenos em um maior, no entanto, meus arquivos ORC são arquivos de log separados por dia e preciso mantê-los separados. Eu só ...