Cuáles son los pros y los contras de ejecutar un trabajo en Hadoop usando varios idiomas?

Question

Mar 05, 2012, 04:14 PM

Cuáles son los pros y los contras de ejecutar un trabajo en Hadoop usando varios idiomas?

He estado usando Pig o Java para Map Reduce exclusivamente para ejecutar trabajos en un clúster Hadoop hasta ahora. Recientemente probé usando Python Map Reduce a través de la transmisión de Hadoop y eso también fue genial. Todo esto tiene sentido para mí, pero estoy un poco confuso sobre cuándo me gustaría usar una implementación v.s. otro. Java map reduce, he estado usando básicamente exclusivamente cuando necesito velocidad, pero ¿cuándo querría usar algo como la transmisión de Python en lugar de simplemente escribir lo mismo en menos líneas, más fáciles de entender en PIG / Hive? En resumen, ¿cuáles son los pros y los contras de cada uno?