Resultados da pesquisa a pedido "apache-pig"
Porco: número de controle dos mapeadores
Eu posso controlar o número de redutores usando a cláusula PARALLEL nas instruções que resultam em redutores. Eu quero controlar o número de mapeadores. A fonte de dados já está criada e não posso reduzir o número de partes na fonte de dados. É ...
Apache Pig: Carrega um arquivo que mostra bem usando o hadoop fs -text
Eu tenho arquivos que são nomeados parte-r-000 [0-9] [0-9] e que contêm campos separados por tabulações. Posso visualizá-los usando
saco de porco latin para tuple após grupo por
Eu tenho os seguintes dados com esquema
Mesclando vários arquivos em um no Hadoop
Eu recebo vários arquivos pequenos no meu diretório de entrada, que desejo mesclar em um único arquivo, sem usar o sistema de arquivos local ou escrever mapreds. Existe uma maneira de fazê-lo usando os comandos hadoof fs ou Pig? Obrigado!
Qual é a diferença entre GROUP e COGROUP no PIG?
Entendi que o Group não funcionava com várias tuplas e, portanto, tínhamos COGROUP no PIG. No entanto, enquanto verifica hoje o comando GROUP funciona para mim. Estou usando o PIG-0.12.0. Meus comandos e saídas são os seguintes. grunt> grpvar = ...
Como posso particionar uma tabela com o HIVE?
Estou brincando com o Hive há alguns dias, mas ainda tenho dificuldades com a partiçã Estou gravando logs do Apache (formato Combinar) no Hadoop há alguns meses. Eles são armazenados no formato de texto de linha, particionados por data ...
Pig Batch mode: como definir o nível de log para ocultar as mensagens de log do INFO?
Usando o ApachePorco versão 0.10.1.21 (rexportado). Quando eu executo um script, há muitas linhas de log de informações que se parecem com isso:
Max / Min para conjuntos inteiros de registros em PIG
Eu tenho um conjunto de registros que estou carregando de um arquivo e a primeira coisa que preciso fazer é obter o máximo e o mínimo de uma coluna. No SQL, eu faria isso com uma subconsulta como esta: select c.state, c.population, (select ...