Carregar arquivo delimitado por dois pontos duplos :: no porco
A seguir, é apresentado um exemplo de conjunto de dados delimitado por dois pontos (: :).
1::Toy Story (1995)::Animation|Children's|Comedy
Eu quero extrair três campos do conjunto de dados acima como movieID, title e gênero. Eu escrevi o seguinte código para isso
movies = LOAD 'location/of/dataset/on/hdfs '
using PigStorage('::')
as
(MovieID:int,title:chararray,genre:chararray);
Mas estou recebendo o seguinte erro
ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1200: Pig script failed to parse:
<file script.pig, line 1, column 9> pig script failed to validate:
java.lang.RuntimeException: could not instantiate 'PigStorage' with arguments '[::]'