Resultados da pesquisa a pedido "hive"

2 a resposta

Como inserir o DataFrame de fluxo estruturado spark na tabela / localização externa do Hiv

ma consulta na integração de streaming estruturado spark com a tabela HIV Tentei fazer alguns exemplos de streaming estruturado com faísc aqui é meu exemplo val spark =SparkSession.builder().appName("StatsAnalyzer") ...

1 a resposta

Como criar um número n de tabelas externas com um único caminho hdfs usando o Hive

É possível criar um número n de tabelas externas apontando para um único caminho de hdfs usando o Hive. Se sim, quais são as vantagens e suas limitaçõe

1 a resposta

Como faço para corrigir “O arquivo só pode ser replicado para 0 nós em vez de minReplication (= 1).”?

Fiz uma pergunta semelhante há um tempo atrás [https://stackoverflow.com/questions/53959342/why-do-i-get-file-could-only-be-replicated-to-0-nodes-when-writing-to-a-partit] e achei que resolvi esse problema, mas acabou que ele desapareceu ...

1 a resposta

xecutando a consulta do Pig sobre os dados armazenados no Hive

Gostaria de saber como executar consultas Pig armazenadas no formato Hive. Eu configurei o Hive para armazenar dados compactados (usando este ...

4 a resposta

hive Expressão que não está no grupo por chave

Crio uma tabela no HIVE. Possui as seguintes colunas: id bigint, rank bigint, date string Quero obter média (classificação) por mês. Eu posso usar este comando. Funciona select a.lens_id, avg(a.rank) from tableA a group by ...

2 a resposta

Update, opção SET no Hive

Sei que não há atualização de arquivo no Hadoop, mas no Hive é possível com o açúcar sintático mesclar os novos valores com os dados antigos da tabela e reescrever a tabela com a saída mesclada, mas se eu tiver os novos valores em Em outra ...

4 a resposta

Tabela Hive de partição por campo existente?

Posso particionar uma tabela do Hive após a inserção por um campo existent Tenho um arquivo de 10 GB com um campo de data e uma hora do dia. Posso carregar esse arquivo em uma tabela e depois inserir sobrescrever em outra tabela particionada que ...

4 a resposta

Como o Hive decide quando usar o mapa reduzido e quando não usar?

Como um exemplo simples, select * from tablename; NÃO entra no mapa reduzir, enquanto select count(*) from tablename;FAZ. Qual é o princípio geral usado para decidir quando usar a redução de mapa (por seção)?

3 a resposta

Como carregar dados da seção do HDFS sem remover o arquivo de orige

Quando carregar dados do HDFS para o Hive, usando LOAD DATA INPATH 'hdfs_file' INTO TABLE tablename; command, parece que ele está movendo o hdfs_file parahive/warehouse dir. É possível (como?) Copiá-lo em vez de movê-lo, para que o arquivo seja ...

7 a resposta

como escrever uma subconsulta e usar a cláusula “In” no Hive

Como posso usar a cláusula In do Hive? Quero escrever algo como este no Hive, selecione x de y onde y.z (selecione z distinto de y) ordene por x; Mas não estou encontrando nenhuma maneira de fazê-lo. Tentei Na cláusula Hive 0.7, estava lançando ...