Resultados da pesquisa a pedido "hive"
Usando o Sqoop para importar dados do MySQL para o Hive
Estou usando o Sqoop (versão 1.4.4) para importar dados do MySQL para o Hive. Os dados serão um subconjunto de uma das tabelas, ou seja, poucas colunas de uma tabela. É necessário criar uma tabela no Hive antes da mão. Ou a importação dos dados ...
Sqoop: Não foi possível carregar a exceção do driver mysql
Instalei o Sqoop na minha máquina local. A seguir, estão as informações de configuração. Bash.bashrc: export HADOOP_HOME=/home/hduser/hadoop export HBASE_HOME=/home/hduser/hbase export HIVE_HOME=/home/hduser/hive export ...
Como transpor / girar dados no hive?
Eu sei que não há maneira direta de transpor dados na seção. Eu segui esta pergunta:Existe uma maneira de transpor dados no Hive? [https://stackoverflow.com/questions/18624991/is-there-a-way-to-transpose-data-in-hive] , mas como não há resposta ...
Função de data da colméia para atingir o dia da semana
Estou procurando uma solução alternativa ou funções de data da seção que dê o dia da semana, Sunday - 1 Monday - 2 Tuesday - 3 Wednesday - 4 Thursday - 5 Friday - 6 Saturday - 7Exigência em detalhes: estou procurando uma função que use a string ...
Tabela do Hive retornando conjunto de resultados vazio em todas as consultas
Criei uma tabela do Hive, que carrega dados de um arquivo de texto. Mas seu resultado vazio retornado é definido em todas as consultas. Eu tentei o seguinte comando: CREATE TABLE table2( id1 INT, id2 INT, id3 INT, id4 STRING, id5 INT, id6 ...
Hive: solução alternativa para junção esquerda não equi
O Hive não oferece suporte a junções não equi: a solução comum é mover a condição de junção para a cláusula where, que funciona bem quando você deseja uma junção interna. mas e uma junção esquerda? Exemplo artificial. Digamos que temos uma ...
Substituir apenas algumas partições em um conjunto de dados spark particionado
Como podemos sobrescrever um conjunto de dados particionado, mas apenas as partições que vamos alterar? Por exemplo, recalculando o trabalho diário da semana passada e substituindo apenas os dados da semana passada. O comportamento padrão do ...
Criando partições de seção por vários meses usando um script
Eu tenho dados há 4 anos. Gostar '2011 2012 2013 2014'Eu tenho que executar consultas com base nos dados de um mês. Então, eu estou criando partições como abaixo. 'ALTER TABLE table1_2010Jan ADD PARTITION(year='2010', month='01', ...
A cláusula LIMIT no HIVE é realmente aleatória?
odocumentação [https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Select]doHIVE observa queLIMIT cláusulareturns rows chosen at random. Eu tenho umSELECT mesa em uma mesa com mais de800,000 registros comLIMIT 1, mas sempre me retorna ...
Tabela DataFrame para Hive do Pandas
Eu sou novo em Python e Hive. Eu esperava receber alguns conselhos. Alguém tem alguma dica sobre como transformar um dataframe de pandas python em uma tabela de seção?