Resultados da pesquisa a pedido "hive"

2 a resposta

Como excluir registros duplicados da tabela do Hive?

Estou tentando aprender sobre a exclusão de registros duplicados de uma tabela do Hive. Tabela My Hive: 'dynpart' com colunas: Id, Nome, Tecnologia Id Name Technology 1 Abcd Hadoop 2 Efgh Java 3 Ijkl MainFrames 2 Efgh JavaTemos opções como ...

1 a resposta

Por que um trabalho somente de mapa na seção resulta em um único arquivo de saída

Quando executo a consulta a seguir, recebo apenas um arquivo como saída, embora tenha 8 mapeadores e 0 redutores. create table table_2 as select * from table_1.8 mapeadores são chamados e não há fase redutora. Existe apenas um arquivo no local ...

3 a resposta

Os carimbos de hora da Impala não correspondem ao Hive - um problema de fuso horário?

Eu tenho alguns dados do log de eventos no HDFS que, em seu formato bruto, são assim: 2015-11-05 19:36:25.764 INFO [...etc...]Uma tabela externa aponta para este local do HDFS: CREATE EXTERNAL TABLE `log_stage`( `event_time` timestamp, [...]) ...

13 a resposta

Hive inserir consulta como SQL

Eu sou novo no ramo, e quero saber se há alguma maneira de inserir dados na tabela de seção como fazemos no SQL. Eu quero inserir meus dados na colméia como

1 a resposta

Diferenças de chave SPARK-HIVE entre Hive e Parquet da perspectiva do processamento do esquema da tabela

Eu sou novo em faísca e colméia. Eu não entendo a afirmação "O Hive considera todas as colunas anuláveis, enquanto a anulabilidade no Parquet é significativa" Se alguém explicar a afirmação com exemplo, será melhor para mim. Agradeça ao seu.

3 a resposta

java.sql.SQLException: Falha ao iniciar o banco de dados 'metastore_db' ERRO, ao inicializar o banco de dados usando o hive

Eu instalei o Hadoop e o Hive no cluster 3. Consegui fazer o login no ramo do meu nó de cluster onde o HIVE está sendo executado.root @ NODE_3 hive] # hive L...

2 a resposta

Tabelas de seção não encontradas ao executar no modo YARN-Cluster

Eu tenho um aplicativo Spark (versão 1.4.1) no HDP 2.3. Funciona bem ao executá-lo no modo YARN-Client. No entanto, ao executá-lo no modo YARN-Cluster, nenhuma das minhas tabelas do Hive pode ser encontrada pelo aplicativo. Eu envio a inscrição ...

6 a resposta

Usando o Sqoop para importar dados do MySQL para o Hive

Estou usando o Sqoop (versão 1.4.4) para importar dados do MySQL para o Hive. Os dados serão um subconjunto de uma das tabelas, ou seja, poucas colunas de uma tabela. É necessário criar uma tabela no Hive antes da mão. Ou a importação dos dados ...

1 a resposta

Delimitador de saída de consulta do Hive

Eu tenho 2 tabelas no Hive - primeiro é externo, o segundo é gerenciado. A tabela gerenciada é preenchida externamente usando INSERT OVERWRITE ... SELECT FRO...

6 a resposta

Exportar a tabela do Hive para um bucket S3

Criei uma tabela do Hive por meio de uma sessão interativa do Elastic MapReduce e a preenchi em um arquivo CSV como este: CREATE TABLE csvimport(id BIGINT, time STRING, log STRING) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'; LOAD DATA LOCAL ...