Jak zaimplementować sortowanie w hadoop?
Moim problemem jest sortowanie wartości w pliku. klucze i wartości są liczbami całkowitymi i muszą utrzymywać klucze posortowanych wartości.
key value
1 24
3 4
4 12
5 23
wydajność:
1 24
5 23
4 12
3 4
Pracuję z ogromnymi danymi i muszę uruchomić kod w klastrze maszyn hadoop. Jak mogę to zrobić z mapreduce?