Resultados da pesquisa a pedido "hiveql"

2 a resposta

Você pode explicar quando e por que o mapreduce é invocado na colméia

select * from Table_name limit 5; select col1_name,col2_name from table_name limit 5; Quando executo a primeira consulta, não há nenhum MapReduce chamado, enquanto para outros o MapReduce é chamado. Poderia explicar o motivo.

2 a resposta

Hadoop / Hive Collect_list sem repetir itens

Com base na postagem,Hive 0.12 - Lista de Coletas [https://stackoverflow.com/questions/6445339/collect-set-in-hive-keep-duplicates] , Estou tentando localizar o código Java para implementar um UDAF que realize essa funcionalidade ou semelhante, ...

2 a resposta

Operador Hive - LIKE

Não consigo descobrir como lido com esse problema: Estes são os meus dados: Table1: Table2: BRAND PRODUCT SOLD Sony Sony ABCD 1233 Apple Sony adv 1233 Google Sony aaaa 1233 IBM Apple 123 1233 etc. Apple 345 1233 IBM 13123 1233É possível filtrar ...

2 a resposta

Funções unix_timestamp e from_unixtime do Hive

Estou com a impressão de queunix_timestampefrom_unixtimeAs funções da seção são "inversas" uma da outra. Quando tento converter a seqüência de carimbo de data e hora em segundos no Hive: SELECT unix_timestamp('10-Jun-15 10.00.00.000000 AM', ...

2 a resposta

Explodir (transpor?) Várias colunas na tabela Spark SQL

Estou usando o Spark SQL (mencionei que ele está no Spark no caso de afetar a sintaxe do SQL - ainda não estou familiarizado o suficiente para ter certeza) e tenho uma tabela que estou tentando reestruturar, mas estou ficar preso ...

2 a resposta

Como passar várias instruções no Spark SQL HiveContext

Por exemplo, tenho algumas instruções Hive HQL que quero passar para o Spark SQL: set parquet.compression=SNAPPY; create table MY_TABLE stored as parquet as select * from ANOTHER_TABLE; select * from MY_TABLE limit 5;O seguinte ...

2 a resposta

Funcionalidade de número de linha no Hive

Como posso gerar números de linha para uma tabela existente durante a execução de uma consulta de seleção? Por exemplo: select row_number(), * from emp;Estou usando a seção 0.13. Não consigo acessar frascos externos ou udfs no meu ambiente. Os ...

2 a resposta

Interseção de matriz no Spark SQL

Eu tenho uma tabela com uma coluna de tipo de matriz chamadawriter que tem valores comoarray[value1, value2], array[value2, value3].... etc. estou fazendoself join para obter resultados que tenham valores comuns entre matrizes. Eu ...

3 a resposta

A cláusula LIMIT no HIVE é realmente aleatória?

odocumentação [https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Select]doHIVE observa queLIMIT cláusulareturns rows chosen at random. Eu tenho umSELECT mesa em uma mesa com mais de800,000 registros comLIMIT 1, mas sempre me retorna ...

3 a resposta

SparkR do Rstudio - fornece erro em invokeJava (isStatic = TRUE, className, methodName,…):

Estou usando o RStudio. Depois de criar a sessão, se eu tentar criar o dataframe usando dados R, ele dá erro. Sys.setenv(SPARK_HOME = "E:/spark-2.0.0-bin-hadoop2.7/spark-2.0.0-bin-hadoop2.7") Sys.setenv(HADOOP_HOME = "E:/winutils") ...