Como ordenar dados no mapa reduzir o hadoop?
Eu estou trabalhando com um programa que tem 4 etapas MapReduce. A saída do meu primeiro passo é:
id value
1 20
2 3
3 9
4 36
Eu tenho cerca de 1.000.000 IDs e na segunda etapa eu devo classificar os valores. A saída desta etapa:
id value
4 36
1 20
3 9
2 3
Como posso classificar meus dados no mapa reduzir? Preciso usar o terasort? Se sim, como uso o terasort na segunda etapa do meu programa? Obrigado.