Resultados da pesquisa a pedido "mapreduce"

1 a resposta

DiskErrorException na máquina escrava - multinode Hadoop

Eu estou tentando processar arquivos XML do hadoop, eu tenho seguinte erro em invocar o trabalho de contagem de palavras em arquivos XML.

1 a resposta

Lendo arquivo como registro único no hadoop

Eu tenho enorme não. de arquivos pequenos, eu quero usar CombineFileInputFormat para mesclar os arquivos de modo que cada arquivo de dados venha como um únic...

7 a resposta

Porco vs Hive vs Mapa Nativo Reduce

Eu tenho uma compreensão básica sobre o que são abstrações de Pig, Hive. Mas não tenho uma ideia clara sobre os cenários que exigem que o Hive, Pig ou o mapa...

1 a resposta

Como definir um redutor para emitir <Text, IntWritable> e um mapeador para receber <Text, IntWritable>?

Estou desenvolvendo algum código emhadoopcommapreduzirque usadois mapeadores e dois redutores.Foi-me dito para usarSequenceFileInputFormate SequenceFileOutputFormatpara que a saída do primeiro redutor e a entrada do segundo mapeador funcionem ...

1 a resposta

Como implementar o tipo no hadoop?

Meu problema é classificar valores em um arquivo. chaves e valores são números inteiros e precisam manter as chaves dos valores classificados.

2 a resposta

Qual é a diferença básica entre jobconf e job?

5 a resposta

Mapa reduz trabalho ficando preso no mapa 0% reduz 0%

Estou executando o famoso exemplo de contagem de palavras. Eu tenho uma configuração local e prod hadoop. O mesmo exemplo está trabalhando em prod, mas não e...

1 a resposta

Estender SequenceFileInputFormat para incluir o nome do arquivo + deslocamento

Eu gostaria de ser capaz de criar um InputFormat personalizado que lê arquivos de seqüência, mas adicionalmente expõe o caminho do arquivo e deslocamento den...

2 a resposta

Como abortar um trabalho de RM dentro de um mapeador (ou redutor)

6 a resposta

Não é possível inicializar o cluster. Por favor, verifique sua configuração para mapreduce.framework.name e o correspondente servidor-submiting job2remoteClustr