hadoop getmerge на другую машину
Можно ли сохранить выходные данныеhadoop dfs -getmerge
командовать на другой машине?
Причина в том, что на моей локальной машине недостаточно места. Выходная информация задания составляет 100 ГБ, а локальное хранилище - 60 ГБ.
Другой возможной причиной может быть то, что я хочу обработать вывод в другой программе локально, на другом компьютере, и я не хочу передавать его дважды (HDFS-> локальная FS -> удаленная машина). Я просто хочу (HDFS -> удаленный компьютер).
Я ищу что-то похожее на то, какscp
работает, как:
hadoop dfs -getmerge /user/hduser/Job-output user@someIP:/home/user/
Кроме того, я также хотел бы получить данные HDFS с удаленного хоста на мой локальный компьютер.
Можно ли использовать Unix конвейеры в этом случае?
Для тех, кто не знаком с hadoop, я просто ищу способ заменить локальный параметр dir (/user/hduser/Job-output
) в этой команде с каталогом на удаленной машине.