Resultados da pesquisa a pedido "hive"
Comando Hive para executar a cláusula NOT IN
Eu tenho duas tabelas, tab1 e tab2. tab1(T1) tab2(T2) a1 b1 b1 c1 c1 f1 d1 g1Estou procurando os valores da tabela T1 que não estão presentes no T2. Nesse caso, a saída deve sera1 d1 Eu tentei com a seguinte consulta, mas não consegui a solução ...
Criando partições de seção por vários meses usando um script
Eu tenho dados há 4 anos. Gostar '2011 2012 2013 2014'Eu tenho que executar consultas com base nos dados de um mês. Então, eu estou criando partições como abaixo. 'ALTER TABLE table1_2010Jan ADD PARTITION(year='2010', month='01', ...
Tabela DataFrame para Hive do Pandas
Eu sou novo em Python e Hive. Eu esperava receber alguns conselhos. Alguém tem alguma dica sobre como transformar um dataframe de pandas python em uma tabela de seção?
Como fazer com que o Spark Streaming escreva sua saída para que o Impala possa lê-la?
Eu tenho o seguinte problema com a API de streaming do Spark. Atualmente, estou transmitindo dados de entrada via Flume para Spark Streaming, com o qual pretendo fazer um pré-processamento para os dados. Em seguida, gostaria de salvar os dados no ...
Exceção ao acessar o banco de dados GeoIP-country.mmdb da maxmind através do hive
Eu tenho uma UDF de seção personalizada para acessar o MaxmindGeoIP-country.mmdb banco de dados que é adicionado aos recursos da seção por meio de "adicionar arquivo pqr.mmdb". O UDF compilado é adicionado como "add jar abc.jar" Quando executo ...
ARRAY_CONTAINS valores múltiplos na seção
Existe uma maneira conveniente de usar a função ARRAY_CONTAINS na seção para procurar várias entradas em uma coluna da matriz em vez de apenas uma? Então, ao invés de: WHERE ARRAY_CONTAINS(array, val1) OR ARRAY_CONTAINS(array, val2)Eu gostaria ...
Como ingressar em duas tabelas no HIVE.
Eu tenho duas tabelas A e B que ambas têm a seguinte estrutura. // Table A Name Age actualdate no // Table B City sdate edate idDesejo obter todos os campos de A e B usando JOIN onde, id = no e sdate <= data atual e data> = data atual. Eu ...
Acessando tabelas do Hive com faísca
Eu tenho a instalação do Hive 0.13 e criei bancos de dados personalizados. Eu tenho o cluster de nó único do spark 1.1.0, criado usando a opção mvn -hive. Eu quero acessar tabelas neste banco de dados no aplicativo spark usando o hivecontext. Mas ...
Como posso adicionar uma coluna de carimbo de data / hora na seção
Eu tenho 2 linhas como abaixo: 941 78 252 3008 86412 1718502 257796 2223252 292221 45514 114894 980 78 258 3064 88318 1785623 269374 2322408 305467 46305 116970Quero inserir o carimbo de data / hora atual ao inserir cada linha. finalmente, na ...
O comando hive no script bash não carrega o arquivo na tabela
Estou escrevendo um script bash que - entre outras coisas - precisa criar uma tabela de seção e carregar um arquivo csv (cujo nome não é conhecido a priori) nessa tabela. Eu exportei o nome do arquivofoo.csv na variável de ambientemyfile e tentei ...