Wyodrębnij pierwszą linię pliku CSV w Pig
Mam kilka plików CSV, a nagłówek jest zawsze pierwszym wierszem w pliku. Jaki jest najlepszy sposób na usunięcie tej linii z pliku CSV jako ciąg w Pig? Wstępne przetwarzanie za pomocą sed, awk itp. Nie jest opcją.
Próbowałem załadować plik za pomocą zwykłego PigStorage i Piggy Bank CsvLoader, ale nie jest dla mnie jasne, jak mogę uzyskać tę pierwszą linię, jeśli w ogóle.
Jestem otwarty na pisanie UDF, jeśli tego wymaga.