Resultados da pesquisa a pedido "hiveql"

2 a resposta

Você pode explicar quando e por que o mapreduce é invocado na colméia

select * from Table_name limit 5; select col1_name,col2_name from table_name limit 5; Quando executo a primeira consulta, não há nenhum MapReduce chamado, enquanto para outros o MapReduce é chamado. Poderia explicar o motivo.

2 a resposta

Hadoop / Hive Collect_list sem repetir itens

Com base na postagem,Hive 0.12 - Lista de Coletas [https://stackoverflow.com/questions/6445339/collect-set-in-hive-keep-duplicates] , Estou tentando localizar o código Java para implementar um UDAF que realize essa funcionalidade ou semelhante, ...

2 a resposta

Operador Hive - LIKE

Não consigo descobrir como lido com esse problema: Estes são os meus dados: Table1: Table2: BRAND PRODUCT SOLD Sony Sony ABCD 1233 Apple Sony adv 1233 Google Sony aaaa 1233 IBM Apple 123 1233 etc. Apple 345 1233 IBM 13123 1233É possível filtrar ...

1 a resposta

Hive UDF para selecionar todas, exceto algumas colunas

O padrão de criação de consulta comum no HiveQL (e SQL em geral) é selecionar todas as colunas (SELECT *) ou um conjunto de colunas explicitamente especificado (SELECT A, B, C) O SQL não possui mecanismo interno para selecionar todas, exceto um ...

2 a resposta

Funções unix_timestamp e from_unixtime do Hive

Estou com a impressão de queunix_timestampefrom_unixtimeAs funções da seção são "inversas" uma da outra. Quando tento converter a seqüência de carimbo de data e hora em segundos no Hive: SELECT unix_timestamp('10-Jun-15 10.00.00.000000 AM', ...

7 a resposta

Como exportar dados do Spark SQL para CSV

Este comando funciona com o HiveQL: insert overwrite directory '/data/home.csv' select * from testtable;Mas com o Spark SQL, estou recebendo um erro com umorg.apache.spark.sql.hive.HiveQl rastreamento de pilha: java.lang.RuntimeException: ...

1 a resposta

Otimização de junção do Hive

Eu tenho dois conjuntos de dados armazenados em um bucket S3 que eu preciso processar no Hive e armazenar a saída novamente no S3. As linhas de amostra de cada conjunto de dados são as seguintes: DataSet 1: ...

2 a resposta

Explodir (transpor?) Várias colunas na tabela Spark SQL

Estou usando o Spark SQL (mencionei que ele está no Spark no caso de afetar a sintaxe do SQL - ainda não estou familiarizado o suficiente para ter certeza) e tenho uma tabela que estou tentando reestruturar, mas estou ficar preso ...

1 a resposta

Não foi possível conectar ao HIVE2 via JAVA

[/imgs/FESNi.jpg]Referindo-se aHive2 [https://cwiki.apache.org/confluence/display/Hive/HiveServer2+Clients#HiveServer2Clients-JDBC] criei um programa java simples para conectar-se ao servidor HIVE2 (não local), adicionamos todos os frascos ...

1 a resposta

Looping usando o Hiveql

Estou tentando mesclar 2 conjuntos de dados, digamos A e B. O conjunto de dados A tem uma variável "Flag", que leva 2 valores. Em vez de apenas mesclar os dois dados, eu estava tentando mesclar 2 conjuntos de dados com base na variável "flag". O ...