Jak sortować dane na mapie zmniejszyć hadoop?
Pracuję z programem, który ma 4 kroki MapReduce. Rezultatem mojego pierwszego kroku jest:
id value
1 20
2 3
3 9
4 36
Mam około 1 000 000 identyfikatorów, aw drugim kroku muszę posortować wartości. Wynik tego kroku:
id value
4 36
1 20
3 9
2 3
Jak zmniejszyć sortowanie danych na mapie? Czy muszę korzystać z terasortu? Jeśli tak, jak mogę użyć terasortu w drugim kroku mojego programu? Dzięki.