Каковы плюсы и минусы работы в Hadoop с использованием разных языков?

До сих пор я использовал Pig или Java для Map Reduce исключительно для запуска заданий на кластере Hadoop. Недавно я попробовал использовать Python Map Reduce с помощью потоковой передачи Hadoop, и это было довольно круто. Все это имеет смысл для меня, но я немного сомневаюсь, когда захочу использовать одну реализацию v.s. еще один. Сокращение Java-карты, я использую в основном исключительно тогда, когда мне нужна скорость, но когда я захочу использовать что-то вроде потоковой передачи Python вместо того, чтобы просто записывать то же самое в меньшем количестве, более понятных строк в PIG / Hive? Короче, каковы плюсы и минусы каждому?

Ответы на вопрос(3)

Ваш ответ на вопрос