Resultados da pesquisa a pedido "mapreduce"
Melhor maneira de fazer um "muitos" JOIN no CouchDB
Estou procurando um CouchDB equivalente a "SQL joins". No meu exemplo, existem documentos do CouchDB que são elementos da lista: { "type" : "el", "id" : "1", "content" : "first" } { "type" : "el", "id" : "2", "content" : "second" } { "type" : ...
Execute o trabalho do Hadoop sem usar o JobConf
Não consigo encontrar um único exemplo de envio de uma tarefa do Hadoop que não use a opção descontinuadaJobConf classe.JobClient, que não foi preterido, ainda suporta apenas métodos que levam umJobConf parâmetro. Alguém pode me indicar um ...
IllegalAccessError para o StopWatch da goiaba de org.apache.hadoop.mapreduce.lib.input.FileInputFormat.listStatus
Estou tentando executar o aplicativo spark pequeno e estou recebendo a seguinte exceção: Exception in thread "main" java.lang.IllegalAccessError: tried to access method com.google.common.base.Stopwatch.<init>()V from ...
Como faço para definir um objeto como a saída de valor para mapa no Hadoop MapReduce?
No Hadoop MapReduce, para a saída intermediária (gerada pelo map ()), eu quero que o valor da saída Intermediária seja o objeto a seguir.
Particionador Hadoop
Quero perguntar sobre o particionador Hadoop, ele é implementado no Mappers? Como medir o desempenho do uso do particionador de hash padrão - Existe um particionador melhor para reduzir a inclinação dos dados? obrigado
Exceção de soma de verificação ao ler ou copiar para hdfs no apache hadoop
Eu estou tentando implementar um algoritmo paralelizado usando o Apache hadoop, no entanto, estou enfrentando alguns problemas ao tentar transferir um arquiv...
java.sql.SQLException: Falha ao iniciar o banco de dados 'metastore_db' ERRO, ao inicializar o banco de dados usando o hive
Eu instalei o Hadoop e o Hive no cluster 3. Consegui fazer o login no ramo do meu nó de cluster onde o HIVE está sendo executado.root @ NODE_3 hive] # hive L...
Qual é a melhor maneira de contar visitantes únicos com o Hadoop?
hey all, apenas começando no hadoop e curioso para saber qual a melhor maneira em mapreduce seria contar visitantes únicos se seus arquivos de registro fossem assim ... DATE siteID action username 05-05-2010 siteA pageview jim 05-05-2010 ...
Como as consultas sql do hive são enviadas como trabalho de sr do hive cli
Implantei um cluster CDH-5.9 com o MR como mecanismo de execução de seção. Eu tenho uma tabela de seção chamada "usuários" com 50 linhas. Sempre que executo a consultaselect * from users funciona bem da seguinte maneira: hive> select * from ...