Resultados da pesquisa a pedido "apache-pig"
Como manter o arquivo de log do trabalho PIG quando for bem-sucedido.
Percebi que quando há um erro na execução de um script PIG, um log é gerado e mantido. Mas quando não há erro, o arquivo de log é removido. Existe uma maneir...
Como lidar com memória de derramamento no porco
Meu código é assim:
Apache Pig: Carrega um arquivo que mostra bem usando o hadoop fs -text
Eu tenho arquivos que são nomeados parte-r-000 [0-9] [0-9] e que contêm campos separados por tabulações. Posso visualizá-los usando
encontrar média usando porco ou hadoop
Eu tenho um enorme arquivo de texto de formaos dados são salvos no diretório data / data1.txt, data2.txt e assim por diante
Como você melhora o desempenho em um trabalho sujo que possui dados muito distorcidos?
Estou executando um script de porco que executa um GROUP BY e um FOREACH aninhado que leva horas para ser executado devido a uma ou duas tarefas de redução. ...
Pig UDF em execução no EMR do AWS com java.lang.NoClassDefFoundError: org / apache / pig / LoadFunc
Estou desenvolvendo um aplicativo que tenta ler o arquivo de log armazenado em dólares do S3 e analisá-lo usando o Elastic MapReduce. Atual o arquivo de log ...