Resultados da pesquisa a pedido "hive"
Adivinhador de tipo de dados Spark UDAF
Queria levar algo assim https://github.com/fitzscott/AirQuality/blob/master/HiveDataTypeGuesser.java [https://github.com/fitzscott/AirQuality/blob/master/HiveDataTypeGuesser.java]e crie um Hive UDAF para criar uma função agregada que retorna uma ...
Onde está o erro de sintaxe nesta consulta simples do Hive com STRUCT?
Vamos importar uma tabela simples no Hive: hive> CREATE EXTERNAL TABLE tweets (id BIGINT, id_str STRING, user STRUCT<id:BIGINT, screen_name:STRING>) ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.JsonSerde' LOCATION '/projets/tweets'; ...
Hive: lançando a matriz <string> para a matriz <int> na consulta
Eu tenho duas mesas : create table a ( `1` array<string>); create table b ( `1` array<int>);e eu quero colocar a tabela a na tabela b (a tabela b está vazia): insert into table b select * from a;ao fazer isso, recebo o seguinte erro: FAILED: ...
Amostras aleatórias de tamanho correspondente da tabela de seção
Eu tenho uma mesa de colméiaactivity com colunasuserid, itemiderating, com classificações possíveis de 1 e 0, nas quais existem muito mais classificações positivas (1s) do que classificações negativas (0s). Preciso extrair uma amostra com números ...
Como obter a diferença de data em minutos usando o Hive
A consulta abaixo é minha consulta ao servidor sql e quero convertê-la em consulta de seção: select DATEDIFF([minute], '19000101', '2013-01-01 10:10:10')
Problemas com a execução de várias consultas usando Spark e HiveSQL
Espero que alguém possa me ajudar com esse problema. Dentro do shell de faísca, onde se eu tentar algo como abaixo: var sqlContext = new org.apache.spark.sql.hive.HiveContext(sc) var query = "select * from myDB.table limit 10; drop table if ...
Os carimbos de hora da Impala não correspondem ao Hive - um problema de fuso horário?
Eu tenho alguns dados do log de eventos no HDFS que, em seu formato bruto, são assim: 2015-11-05 19:36:25.764 INFO [...etc...]Uma tabela externa aponta para este local do HDFS: CREATE EXTERNAL TABLE `log_stage`( `event_time` timestamp, [...]) ...
Consulta do Hive com vários operadores LIKE
Qual seria a maneira correta de escrever uma consulta do Hive com vários operadores LIKE como este: SELECT * FROM some_table WHERE some_col LIKE '%abc%' OR some_col LIKE '%xyz%' OR some_col LIKE '%pqr%' OR ... (some more LIKE statements)Eu ...
Qual é a diferença entre Apache Spark SQLContext e HiveContext?
Quais são as diferenças entre o Apache Spark SQLContext e o HiveContext? Algumas fontes dizem que, como o HiveContext é um superconjunto do SQLContext, os desenvolvedores devem sempre usar o HiveContext, que possui mais recursos que o ...
Classificação computacional de uma linha
Quero classificar o ID do usuário com base em um campo. Para o mesmo valor do campo, a classificação deve ser a mesma. Esses dados estão na tabela do Hive. por exemplo. user value a 5 b 10 c 5 d 6 Rank a - 1 c - 1 d - 3 b - 4Como eu posso ...