Resultados da pesquisa a pedido "hiveql"
Você pode explicar quando e por que o mapreduce é invocado na colméia
select * from Table_name limit 5; select col1_name,col2_name from table_name limit 5; Quando executo a primeira consulta, não há nenhum MapReduce chamado, enquanto para outros o MapReduce é chamado. Poderia explicar o motivo.
Hadoop / Hive Collect_list sem repetir itens
Com base na postagem,Hive 0.12 - Lista de Coletas [https://stackoverflow.com/questions/6445339/collect-set-in-hive-keep-duplicates] , Estou tentando localizar o código Java para implementar um UDAF que realize essa funcionalidade ou semelhante, ...
Operador Hive - LIKE
Não consigo descobrir como lido com esse problema: Estes são os meus dados: Table1: Table2: BRAND PRODUCT SOLD Sony Sony ABCD 1233 Apple Sony adv 1233 Google Sony aaaa 1233 IBM Apple 123 1233 etc. Apple 345 1233 IBM 13123 1233É possível filtrar ...
Hive UDF para selecionar todas, exceto algumas colunas
O padrão de criação de consulta comum no HiveQL (e SQL em geral) é selecionar todas as colunas (SELECT *) ou um conjunto de colunas explicitamente especificado (SELECT A, B, C) O SQL não possui mecanismo interno para selecionar todas, exceto um ...
Funções unix_timestamp e from_unixtime do Hive
Estou com a impressão de queunix_timestampefrom_unixtimeAs funções da seção são "inversas" uma da outra. Quando tento converter a seqüência de carimbo de data e hora em segundos no Hive: SELECT unix_timestamp('10-Jun-15 10.00.00.000000 AM', ...
Como exportar dados do Spark SQL para CSV
Este comando funciona com o HiveQL: insert overwrite directory '/data/home.csv' select * from testtable;Mas com o Spark SQL, estou recebendo um erro com umorg.apache.spark.sql.hive.HiveQl rastreamento de pilha: java.lang.RuntimeException: ...
Otimização de junção do Hive
Eu tenho dois conjuntos de dados armazenados em um bucket S3 que eu preciso processar no Hive e armazenar a saída novamente no S3. As linhas de amostra de cada conjunto de dados são as seguintes: DataSet 1: ...
Explodir (transpor?) Várias colunas na tabela Spark SQL
Estou usando o Spark SQL (mencionei que ele está no Spark no caso de afetar a sintaxe do SQL - ainda não estou familiarizado o suficiente para ter certeza) e tenho uma tabela que estou tentando reestruturar, mas estou ficar preso ...
Não foi possível conectar ao HIVE2 via JAVA
[/imgs/FESNi.jpg]Referindo-se aHive2 [https://cwiki.apache.org/confluence/display/Hive/HiveServer2+Clients#HiveServer2Clients-JDBC] criei um programa java simples para conectar-se ao servidor HIVE2 (não local), adicionamos todos os frascos ...
Looping usando o Hiveql
Estou tentando mesclar 2 conjuntos de dados, digamos A e B. O conjunto de dados A tem uma variável "Flag", que leva 2 valores. Em vez de apenas mesclar os dois dados, eu estava tentando mesclar 2 conjuntos de dados com base na variável "flag". O ...