¿Cómo ordenar los datos en el mapa reducir hadoop?
Estoy trabajando con un programa que tiene 4 pasos de MapReduce. El resultado de mi primer paso es:
id value
1 20
2 3
3 9
4 36
Tengo alrededor de 1,000,000 ID y en el segundo paso debo ordenar los valores. La salida de este paso:
id value
4 36
1 20
3 9
2 3
¿Cómo puedo ordenar mis datos en mapa reducir? ¿Necesito usar terasort? Si es así, ¿cómo uso terasort en el segundo paso de mi programa? Gracias.