Resultados da pesquisa a pedido "hive"
Apache hive MSCK REPAIR TABLE nova partição não adicionada
Eu sou novo no Apache Hive. Enquanto trabalho na partição de tabela externa, se eu adicionar uma nova partição diretamente ao HDFS, a nova partição não será adicionada após a execução da tabela MSCK REPAIR. Abaixo estão os códigos que tentei, - ...
Adicionando boiões de colmeia permanentemente
Existe alguma maneira de adicionar permanentemente os jars do hive em vez de adicionar no nível da sessão no shell do hive? Qualquer ajuda seria apreciada
Como conectar-se a um metastore Hive programaticamente no SparkSQL?
Estou usando o HiveContext com SparkSQL e estou tentando conectar-me a um metastore remoto do Hive, a única maneira de definir o metastore do hive é através da inclusão do hive-site.xml no caminho de classe (ou copiando-o para / etc / spark / ...
Hive Crie vários arquivos pequenos para cada inserção no HDFS
o seguinte já foi alcançado Produtor Kafka que extrai dados do twitter usando o Spark Streaming.Consumidor Kafka que ingere dados na tabela Hive External (no HDFS).enquanto isso está funcionando bem até agora. há apenas um problema que estou ...
Meu cliente Hive parou de trabalhar com a instância do Cosmos
Eu tenho um cliente Hive (escrito em Java) que funcionou bem com a Instância Global do Cosmos no FIWARE Lab. No entanto, ele não está mais funcionando, parece que o cliente não pode se conectar (o tempo limite excede). Alguma coisa mudou no lado ...
Hive FAILED: a linha ParseException 2: 0 não pode reconhecer a entrada próxima a '' macaddress '' 'CHAR' '(' na especificação da coluna
Eu tentei correrhive -v -f sqlfile.sql Aqui está o conteúdo do arquivo CREATE TABLE UpStreamParam ( 'macaddress' CHAR(50), 'datats' BIGINT, 'cmtstimestamp' BIGINT, 'modulation' INT, 'chnlidx' INT, 'severity' BIGINT, 'rxpower' FLOAT, 'sigqnoise' ...
Parquet vs ORC vs ORC com Snappy
Estou executando alguns testes nos formatos de armazenamento disponíveis no Hive e usando o Parquet e o ORC como principais opções. Incluí o ORC uma vez com a compactação padrão e outra com o Snappy. Eu li muitos documentos que afirmam que o ...
Otimização de junção do Hive
Eu tenho dois conjuntos de dados armazenados em um bucket S3 que eu preciso processar no Hive e armazenar a saída novamente no S3. As linhas de amostra de cada conjunto de dados são as seguintes: DataSet 1: ...
Fila de tarefas para a ação do Hive no oozie
Eu tenho um fluxo de trabalho oozie. Estou enviando todas as ações da seção com <name>mapred.job.queue.name</name> <value>${queueName}</value>Porém, para poucas ações de seção, o trabalho iniciado não está na fila especificada; é chamado na fila ...
Hive - Funcionalidade não dinâmica no hive
Eu tenho duas tabelas da seguinte maneira: Quadro A userid | code | code_name | property_id 0001 | 1 | apple_id | Y1234 0031 | 4 | mango_id | G4567 0008 | 3 | grape_id | H1209 00013 | 2 | peach_id | Z5643Tabela 2 apple_id | mango_id | grape_id ...