Resultados da pesquisa a pedido "apache-pig"

2 a resposta

Porco: número de controle dos mapeadores

Eu posso controlar o número de redutores usando a cláusula PARALLEL nas instruções que resultam em redutores. Eu quero controlar o número de mapeadores. A fonte de dados já está criada e não posso reduzir o número de partes na fonte de dados. É ...

2 a resposta

Depurando em PIG UDF

2 a resposta

Apache Pig: Carrega um arquivo que mostra bem usando o hadoop fs -text

Eu tenho arquivos que são nomeados parte-r-000 [0-9] [0-9] e que contêm campos separados por tabulações. Posso visualizá-los usando

3 a resposta

saco de porco latin para tuple após grupo por

Eu tenho os seguintes dados com esquema

8 a resposta

Mesclando vários arquivos em um no Hadoop

Eu recebo vários arquivos pequenos no meu diretório de entrada, que desejo mesclar em um único arquivo, sem usar o sistema de arquivos local ou escrever mapreds. Existe uma maneira de fazê-lo usando os comandos hadoof fs ou Pig? Obrigado!

1 a resposta

Qual é a diferença entre GROUP e COGROUP no PIG?

Entendi que o Group não funcionava com várias tuplas e, portanto, tínhamos COGROUP no PIG. No entanto, enquanto verifica hoje o comando GROUP funciona para mim. Estou usando o PIG-0.12.0. Meus comandos e saídas são os seguintes. grunt> grpvar = ...

1 a resposta

como cancelar o comando no shell GRUNT

2 a resposta

Como posso particionar uma tabela com o HIVE?

Estou brincando com o Hive há alguns dias, mas ainda tenho dificuldades com a partiçã Estou gravando logs do Apache (formato Combinar) no Hadoop há alguns meses. Eles são armazenados no formato de texto de linha, particionados por data ...

3 a resposta

Pig Batch mode: como definir o nível de log para ocultar as mensagens de log do INFO?

Usando o ApachePorco versão 0.10.1.21 (rexportado). Quando eu executo um script, há muitas linhas de log de informações que se parecem com isso:

1 a resposta

Max / Min para conjuntos inteiros de registros em PIG

Eu tenho um conjunto de registros que estou carregando de um arquivo e a primeira coisa que preciso fazer é obter o máximo e o mínimo de uma coluna. No SQL, eu faria isso com uma subconsulta como esta: select c.state, c.population, (select ...