Trabajo de MapReduce con fuentes de datos mixtas: tabla HBase y archivos HDFS

Necesito implementar un trabajo de MR que acceda a los datos desde la tabla HBase y los archivos HDFS. Por ejemplo, el asignador lee datos de la tabla HBase y de archivos HDFS, estos datos comparten la misma clave principal pero tienen un esquema diferente. Un reductor luego une todas las columnas (de la tabla HBase y los archivos HDFS).

Intenté buscar en línea y no pude encontrar una manera de ejecutar un trabajo de MR con una fuente de datos tan mixta. Las entradas múltiples parecen funcionar solo para múltiples fuentes de datos HDFS. Por favor déjame saber si tienes algunas ideas. Código de muestra sería genial.

Respuestas a la pregunta(3)

Su respuesta a la pregunta