Resultados da pesquisa a pedido "hive"

2 a resposta

Apache hive MSCK REPAIR TABLE nova partição não adicionada

Eu sou novo no Apache Hive. Enquanto trabalho na partição de tabela externa, se eu adicionar uma nova partição diretamente ao HDFS, a nova partição não será adicionada após a execução da tabela MSCK REPAIR. Abaixo estão os códigos que tentei, - ...

3 a resposta

Adicionando boiões de colmeia permanentemente

Existe alguma maneira de adicionar permanentemente os jars do hive em vez de adicionar no nível da sessão no shell do hive? Qualquer ajuda seria apreciada

5 a resposta

Como conectar-se a um metastore Hive programaticamente no SparkSQL?

Estou usando o HiveContext com SparkSQL e estou tentando conectar-me a um metastore remoto do Hive, a única maneira de definir o metastore do hive é através da inclusão do hive-site.xml no caminho de classe (ou copiando-o para / etc / spark / ...

3 a resposta

Hive Crie vários arquivos pequenos para cada inserção no HDFS

o seguinte já foi alcançado Produtor Kafka que extrai dados do twitter usando o Spark Streaming.Consumidor Kafka que ingere dados na tabela Hive External (no HDFS).enquanto isso está funcionando bem até agora. há apenas um problema que estou ...

1 a resposta

Meu cliente Hive parou de trabalhar com a instância do Cosmos

Eu tenho um cliente Hive (escrito em Java) que funcionou bem com a Instância Global do Cosmos no FIWARE Lab. No entanto, ele não está mais funcionando, parece que o cliente não pode se conectar (o tempo limite excede). Alguma coisa mudou no lado ...

2 a resposta

Hive FAILED: a linha ParseException 2: 0 não pode reconhecer a entrada próxima a '' macaddress '' 'CHAR' '(' na especificação da coluna

Eu tentei correrhive -v -f sqlfile.sql Aqui está o conteúdo do arquivo CREATE TABLE UpStreamParam ( 'macaddress' CHAR(50), 'datats' BIGINT, 'cmtstimestamp' BIGINT, 'modulation' INT, 'chnlidx' INT, 'severity' BIGINT, 'rxpower' FLOAT, 'sigqnoise' ...

5 a resposta

Parquet vs ORC vs ORC com Snappy

Estou executando alguns testes nos formatos de armazenamento disponíveis no Hive e usando o Parquet e o ORC como principais opções. Incluí o ORC uma vez com a compactação padrão e outra com o Snappy. Eu li muitos documentos que afirmam que o ...

1 a resposta

Otimização de junção do Hive

Eu tenho dois conjuntos de dados armazenados em um bucket S3 que eu preciso processar no Hive e armazenar a saída novamente no S3. As linhas de amostra de cada conjunto de dados são as seguintes: DataSet 1: ...

1 a resposta

Fila de tarefas para a ação do Hive no oozie

Eu tenho um fluxo de trabalho oozie. Estou enviando todas as ações da seção com <name>mapred.job.queue.name</name> <value>${queueName}</value>Porém, para poucas ações de seção, o trabalho iniciado não está na fila especificada; é chamado na fila ...

2 a resposta

Hive - Funcionalidade não dinâmica no hive

Eu tenho duas tabelas da seguinte maneira: Quadro A userid | code | code_name | property_id 0001 | 1 | apple_id | Y1234 0031 | 4 | mango_id | G4567 0008 | 3 | grape_id | H1209 00013 | 2 | peach_id | Z5643Tabela 2 apple_id | mango_id | grape_id ...