Resultados da pesquisa a pedido "hiveql"
Você pode explicar quando e por que o mapreduce é invocado na colméia
select * from Table_name limit 5; select col1_name,col2_name from table_name limit 5; Quando executo a primeira consulta, não há nenhum MapReduce chamado, enquanto para outros o MapReduce é chamado. Poderia explicar o motivo.
Hadoop / Hive Collect_list sem repetir itens
Com base na postagem,Hive 0.12 - Lista de Coletas [https://stackoverflow.com/questions/6445339/collect-set-in-hive-keep-duplicates] , Estou tentando localizar o código Java para implementar um UDAF que realize essa funcionalidade ou semelhante, ...
Operador Hive - LIKE
Não consigo descobrir como lido com esse problema: Estes são os meus dados: Table1: Table2: BRAND PRODUCT SOLD Sony Sony ABCD 1233 Apple Sony adv 1233 Google Sony aaaa 1233 IBM Apple 123 1233 etc. Apple 345 1233 IBM 13123 1233É possível filtrar ...
Funções unix_timestamp e from_unixtime do Hive
Estou com a impressão de queunix_timestampefrom_unixtimeAs funções da seção são "inversas" uma da outra. Quando tento converter a seqüência de carimbo de data e hora em segundos no Hive: SELECT unix_timestamp('10-Jun-15 10.00.00.000000 AM', ...
Explodir (transpor?) Várias colunas na tabela Spark SQL
Estou usando o Spark SQL (mencionei que ele está no Spark no caso de afetar a sintaxe do SQL - ainda não estou familiarizado o suficiente para ter certeza) e tenho uma tabela que estou tentando reestruturar, mas estou ficar preso ...
Como passar várias instruções no Spark SQL HiveContext
Por exemplo, tenho algumas instruções Hive HQL que quero passar para o Spark SQL: set parquet.compression=SNAPPY; create table MY_TABLE stored as parquet as select * from ANOTHER_TABLE; select * from MY_TABLE limit 5;O seguinte ...
Funcionalidade de número de linha no Hive
Como posso gerar números de linha para uma tabela existente durante a execução de uma consulta de seleção? Por exemplo: select row_number(), * from emp;Estou usando a seção 0.13. Não consigo acessar frascos externos ou udfs no meu ambiente. Os ...
Interseção de matriz no Spark SQL
Eu tenho uma tabela com uma coluna de tipo de matriz chamadawriter que tem valores comoarray[value1, value2], array[value2, value3].... etc. estou fazendoself join para obter resultados que tenham valores comuns entre matrizes. Eu ...
A cláusula LIMIT no HIVE é realmente aleatória?
odocumentação [https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Select]doHIVE observa queLIMIT cláusulareturns rows chosen at random. Eu tenho umSELECT mesa em uma mesa com mais de800,000 registros comLIMIT 1, mas sempre me retorna ...
SparkR do Rstudio - fornece erro em invokeJava (isStatic = TRUE, className, methodName,…):
Estou usando o RStudio. Depois de criar a sessão, se eu tentar criar o dataframe usando dados R, ele dá erro. Sys.setenv(SPARK_HOME = "E:/spark-2.0.0-bin-hadoop2.7/spark-2.0.0-bin-hadoop2.7") Sys.setenv(HADOOP_HOME = "E:/winutils") ...