Resultados de la búsqueda a petición "hadoop"
¿Cómo manejan las dependencias oozie?
Tengo varias preguntas sobre las bibliotecas compartidas de oozie 2.3:Actualmente, definí las bibliotecas compartidas en nuestro coordinator.properties:
Recursos / Documentación sobre cómo funciona el proceso de conmutación por error para el Spark Driver (y su YARN Container) en modo hilo-clúster
Estoy tratando de entender si el Spark Driver es un punto único de falla cuando se implementa en modo de clúster para Yarn. Por lo tanto, me gustaría obtener una mejor comprensión de las entrañas del proceso de conmutación por error con respecto ...
¿Cómo leer recursivamente archivos Hadoop desde el directorio usando Spark?
Dentro del directorio dado tengo muchas carpetas diferentes y dentro de cada carpeta tengo archivos Hadoop (part_001, etc.) directory -> folder1 -> part_001... -> part_002... -> folder2 -> part_001... ... Dado el directorio, ¿cómo puedo leer ...
¿Cómo ordenar numéricamente en la fase de orden aleatorio de hadoop?
Los datos se ven así, el primer campo es un número,
Ejecutar una aplicación Hadoop independiente en múltiples núcleos de CPU
Mi equipo creó una aplicación Java utilizando las bibliotecas Hadoop para transformar un montón de archivos de entrada en resultados útiles. Dada la carga actual, un solo servidor multinúcleo funcionará bien durante el próximo año más o menos. No ...
MapReduceBase y Mapper en desuso
public static class Map extends MapReduceBase implements MapperMapReduceBase, Mapper yJobConf están en desuso enHadoop 0.20.203. ¿Qué debemos usar ahora? Edit 1 - para elMapper y elMapReduceBase, Descubrí que solo necesitamos ...