¿Cómo implementar auto-join / cross-product con hadoop?

Es una tarea común realizar una evaluación en pares de elementos: Ejemplos: desduplicación, filtrado colaborativo, elementos similares, etc. Esto es básicamente una auto-unión o un producto cruzado con la misma fuente de datos.

Respuestas a la pregunta(2)

Su respuesta a la pregunta