Resultados de la búsqueda a petición "orc"

5 la respuesta

Parquet vs ORC vs ORC con Snappy

Estoy ejecutando algunas pruebas en los formatos de almacenamiento disponibles con Hive y usando Parquet y ORC como opciones principales. Incluí ORC una vez con compresión predeterminada y una vez con Snappy. He leído muchos documentos que ...

2 la respuesta

¿Cómo combino o combino archivos ORC pequeños en un archivo ORC más grande?

La mayoría de las preguntas / respuestas sobre SO y la web discuten el uso de Hive para combinar un montón de pequeños archivos ORC en uno más grande, sin embargo, mis archivos ORC son archivos de registro que están separados por día y necesito ...

2 la respuesta

Archivo ORC de Hadoop - Cómo funciona - Cómo obtener metadatos

Soy nuevo en el archivo ORC. Revisé muchos blogs, pero no obtuve una comprensión clara. Por favor, ayuda y aclara las siguientes preguntas. ¿Puedo recuperar el esquema del archivo ORC? Sé que en Avro, el esquema puede ser recuperado. ¿Cómo ...

4 la respuesta

Agregando múltiples columnas con función personalizada en Spark

Me preguntaba si hay alguna forma de especificar una función de agregación personalizada para marcos de datos de chispa en varias columnas. Tengo una tabla como esta del tipo (nombre, artículo, precio): john | tomato | 1.99 john | carrot | 0.45 ...