Resultados da pesquisa a pedido "hive"
Como inserir o DataFrame de fluxo estruturado spark na tabela / localização externa do Hiv
ma consulta na integração de streaming estruturado spark com a tabela HIV Tentei fazer alguns exemplos de streaming estruturado com faísc aqui é meu exemplo val spark =SparkSession.builder().appName("StatsAnalyzer") ...
Como criar um número n de tabelas externas com um único caminho hdfs usando o Hive
É possível criar um número n de tabelas externas apontando para um único caminho de hdfs usando o Hive. Se sim, quais são as vantagens e suas limitaçõe
Como faço para corrigir “O arquivo só pode ser replicado para 0 nós em vez de minReplication (= 1).”?
Fiz uma pergunta semelhante há um tempo atrás [https://stackoverflow.com/questions/53959342/why-do-i-get-file-could-only-be-replicated-to-0-nodes-when-writing-to-a-partit] e achei que resolvi esse problema, mas acabou que ele desapareceu ...
xecutando a consulta do Pig sobre os dados armazenados no Hive
Gostaria de saber como executar consultas Pig armazenadas no formato Hive. Eu configurei o Hive para armazenar dados compactados (usando este ...
hive Expressão que não está no grupo por chave
Crio uma tabela no HIVE. Possui as seguintes colunas: id bigint, rank bigint, date string Quero obter média (classificação) por mês. Eu posso usar este comando. Funciona select a.lens_id, avg(a.rank) from tableA a group by ...
Update, opção SET no Hive
Sei que não há atualização de arquivo no Hadoop, mas no Hive é possível com o açúcar sintático mesclar os novos valores com os dados antigos da tabela e reescrever a tabela com a saída mesclada, mas se eu tiver os novos valores em Em outra ...
Tabela Hive de partição por campo existente?
Posso particionar uma tabela do Hive após a inserção por um campo existent Tenho um arquivo de 10 GB com um campo de data e uma hora do dia. Posso carregar esse arquivo em uma tabela e depois inserir sobrescrever em outra tabela particionada que ...
Como o Hive decide quando usar o mapa reduzido e quando não usar?
Como um exemplo simples, select * from tablename; NÃO entra no mapa reduzir, enquanto select count(*) from tablename;FAZ. Qual é o princípio geral usado para decidir quando usar a redução de mapa (por seção)?
Como carregar dados da seção do HDFS sem remover o arquivo de orige
Quando carregar dados do HDFS para o Hive, usando LOAD DATA INPATH 'hdfs_file' INTO TABLE tablename; command, parece que ele está movendo o hdfs_file parahive/warehouse dir. É possível (como?) Copiá-lo em vez de movê-lo, para que o arquivo seja ...
como escrever uma subconsulta e usar a cláusula “In” no Hive
Como posso usar a cláusula In do Hive? Quero escrever algo como este no Hive, selecione x de y onde y.z (selecione z distinto de y) ordene por x; Mas não estou encontrando nenhuma maneira de fazê-lo. Tentei Na cláusula Hive 0.7, estava lançando ...