Resultados da pesquisa a pedido "mapreduce"
Melhor maneira de fazer um "muitos" JOIN no CouchDB
Estou procurando um CouchDB equivalente a "SQL joins". No meu exemplo, existem documentos do CouchDB que são elementos da lista: { "type" : "el", "id" : "1", "content" : "first" } { "type" : "el", "id" : "2", "content" : "second" } { "type" : ...
Classe não encontrada no trabalho do Hadoop
Eu tenho um trabalho de redução de mapa que obtém sua entrada do DocumentDB. Eu adicionei aos arquivos jar no diretório lib no meu código-fonte e também utilizei o -libjars ao executar o trabalho. mas ainda recebo o erro de classe não encontrada ...
Tamanho de divisão versus tamanho de bloco no Hadoop
Qual é a relação entre tamanho de divisão e tamanho de bloco no Hadoop? Como eu liesta [http://willddy.github.io/2012/08/25/Hadoop-Split-and-Block.html], o tamanho da divisão deve ser n vezes o tamanho do bloco (n é um número inteiro en> 0), está ...
saída de um programa de mapreduce como entrada para outro programa de mapreduce
Estou tentando um exemplo simples, no qual a saída de um trabalho MapReduce deve ser a entrada de outro trabalho MapReduce. O fluxo deve ser assim:Mapper1 --> Reducer1 --> Mapper2 --> Reducer2 (A saída do Mapper1 deve ser a entrada do Redutor1. ...
Problemas de carregamento do Spark on yarn jar
Estou tentando executar um simples programa java Map / Reduce usando spark over yarn (Cloudera Hadoop 5.2 no CentOS). Eu tentei isso 2 maneiras diferentes. A primeira maneira é a ...
Diferença entre o Application Manager e o Application Master no YARN?
Entendi como o MRv1 funciona. Agora estou tentando entender o MRv2. Qual é a diferença entre o Application Manager e o Application Master no YARN?
Selecionar contagem distinta cloudant / couchdb
Estou iniciando um projeto usando o Cloudant. É um sistema simples de registro, para que eu possa acompanhar o uso dos meus aplicativos. Meus documentos ficam assim: { app: 'nome do aplicativo', type: 'page view | login | etc .. ...
Encontrar o maior valor para a chave
Eu quero descobrir o maior país com maior área. meu conjunto de dados é o seguinte Afghanistan 648 Albania 29 Algeria 2388 Andorra 0 Austria 84 Bahrain 1 Bangladesh 143 Belgium 31 Benin 113 Bhutan 47 Brunei 6 Bulgaria 111 Burma 678 Cameroon 474 ...
Erro Mapreduce: falha ao configurar o diretório local
Estou executando o exemplo mapreduce wordcount no hadoop instalado no Windows 8. Eu recebi o erro como abaixo. Parece um problema de permissão de segurança. Mas não tenho muita certeza. Adicionei uma propriedade ao arquivo yarn-site.xml ...
Exceção no encadeamento “main” org.apache.hadoop.ipc.RemoteException: o servidor IPC versão 9 não pode se comunicar com o cliente versão 4. Como resolver isso?
Estou usando o hadoop 2.7.0 e o java oracle jdk1.7.0_79 com o NetBeans IDE 8.0.2. Quando tento me comunicar com o Hadoop usando o arquivo Java, recebo o seguinte erro. Há algum problema de dependência envolvido? Ou como posso resolver esse ...