Apache Pig: Загрузите файл, который показывает хорошо, используя hadoop fs -text
У меня есть файлы с именем part-r-000 [0-9] [0-9] и содержащие поля, разделенные табуляцией. Я могу просмотреть их, используяhadoop fs -text part-r-00000
но не могу загрузить их, используя свинью.
Что я пробовал:
x = load 'part-r-00000';
dump x;
x = load 'part-r-00000' using TextLoader();
dump x;
но это только дает мне мусор. Как я могу просмотреть файл, используя свинью?
Что может иметь значение, так это то, что мои hdfs все еще используют CDH-2 в данный момент.
Кроме того, если я загружаю файл на локальный компьютер и запускаюfile part-r-00000
это говоритpart-r-00000: data
Я не знаю, как распаковать его локально.