Resultados de la búsqueda a petición "orc"
Parquet vs ORC vs ORC con Snappy
Estoy ejecutando algunas pruebas en los formatos de almacenamiento disponibles con Hive y usando Parquet y ORC como opciones principales. Incluí ORC una vez con compresión predeterminada y una vez con Snappy. He leído muchos documentos que ...
¿Cómo combino o combino archivos ORC pequeños en un archivo ORC más grande?
La mayoría de las preguntas / respuestas sobre SO y la web discuten el uso de Hive para combinar un montón de pequeños archivos ORC en uno más grande, sin embargo, mis archivos ORC son archivos de registro que están separados por día y necesito ...
Archivo ORC de Hadoop - Cómo funciona - Cómo obtener metadatos
Soy nuevo en el archivo ORC. Revisé muchos blogs, pero no obtuve una comprensión clara. Por favor, ayuda y aclara las siguientes preguntas. ¿Puedo recuperar el esquema del archivo ORC? Sé que en Avro, el esquema puede ser recuperado. ¿Cómo ...
Agregando múltiples columnas con función personalizada en Spark
Me preguntaba si hay alguna forma de especificar una función de agregación personalizada para marcos de datos de chispa en varias columnas. Tengo una tabla como esta del tipo (nombre, artículo, precio): john | tomato | 1.99 john | carrot | 0.45 ...