Как реализовать самостоятельное соединение / перекрестный продукт с помощью hadoop?

Обычной задачей является оценка некоторых пар: Примеры: дедупликация, совместная фильтрация, похожие элементы и т. Д. Это в основном самостоятельное объединение или перекрестный продукт с одним и тем же источником данных.

Ответы на вопрос(2)

Ваш ответ на вопрос