Resultados da pesquisa a pedido "hadoop"

1 a resposta

Implementação de um ArrayWritable para um tipo personalizado do Hadoop

Como defino um ArrayWritable para um tipo personalizado do Hadoop? Estou tentando implementar um índice invertido no Hadoop, com tipos personalizados do Hadoop para armazenar os dados eu tenho umLançamento individual classe que armazena o termo ...

6 a resposta

Vale a pena comprar o Mahout in Action para se familiarizar com o Mahout, ou existem outras fontes melhores?

Atualmente sou um usuário muito casual deApache Mahout [http://mahout.apache.org/], e estou pensando em comprar o livroMahout em ação [http://www.manning.com/owen/]. Infelizmente, estou tendo muita dificuldade em ter uma idéia de quanto vale este ...

2 a resposta

excluir pastas de partições em hdfs com mais de N dias

Quero excluir as pastas da partição com mais de N dias. O comando abaixo fornece as pastas exatamente 50 dias atrás. Quero a lista de todas as pastas com menos de 50 dias hadoop fs -ls /data/publish/DMPD/VMCP/staging/tvmcpr_usr_prof/chgdt=`date ...

1 a resposta

Consulta de Junção Temporal no Hive (eventos próximos do tempo)

Preciso de uma consulta de colméia que esteja tendo dificuldades para descobrir. Eu tenho uma série temporal que se parece com isso: time source word1 word2 ...etc 2012-02-01 23:43:16.9988243 0001 2B3B FAF0 2012-02-01 23:43:16.9993561 0002 2326 ...

1 a resposta

Como gerar séries de datas no HIVE? (Criando tabela)

Suponha que atualmente eu tenha uma tabela com 1 linha para cada conta e os dados nas tabelas sejam: Número da contaData de inícioData finalAgora, gostaria de criar uma nova tabela com 1 linha para cada dia em que a conta estiver aberta, ou ...

4 a resposta

HDFS_NAMENODE_USER, HDFS_DATANODE_USER & HDFS_SECONDARYNAMENODE_USER não definido

Eu sou novo no hadoop. Estou tentando instalar o hadoop no meu laptop no modo pseudo-distribuído. Estou executando-o com o usuário root, mas estou recebendo o erro abaixo. root@debdutta-Lenovo-G50-80:~# $HADOOP_PREFIX/sbin/start-dfs.sh ...

1 a resposta

Como resolver o problema de dependência do Guava ao enviar o Uber Jar para o Google Dataproc

Estou usando o plugin maven shade para criar o jar do Uber para enviá-lo como um trabalho para o cluster do google dataproc. O Google instalou o Apache Spark 2.0.2 Apache Hadoop 2.7.3 em seu cluster. O Apache spark 2.0.2 usa 14.0.1 do ...

1 a resposta

Erro de conectividade Hive JDBC Kerberos

Estou tentando conectar ao Hive-Server2 via JDBC. O servidor está ativado pelo kerberos. Estou usando o código a seguir, estou executando o código de um nó de borda em que o arquivo keytab está presente o que estou perdendo? import ...

5 a resposta

Falha no trabalho de streaming do Hadoop em python

Deeste guia [http://www.michael-noll.com/tutorials/writing-an-hadoop-mapreduce-program-in-python/#running-the-python-code-on-hadoop] , Executei com êxito o exercício de amostra. Mas, ao executar meu trabalho de mapreduce, estou recebendo o ...

1 a resposta

Hadoop enable log

Estou tentando trabalhar com o hadoop construído a partir da fonte em um único modo de cluster. Eu fiz check-out 0.22.0-alpha-1. Estou enfrentando alguns problemas com o log. Como habilito os logs de depuração. Eu tentei ...