Resultados da pesquisa a pedido "hadoop-streaming"

1 a resposta

O comando hdfs foi descontinuado no hadoop

Como estou seguindo o procedimento ...

2 a resposta

Hive FAILED: a linha ParseException 2: 0 não pode reconhecer a entrada próxima a '' macaddress '' 'CHAR' '(' na especificação da coluna

Eu tentei correrhive -v -f sqlfile.sql Aqui está o conteúdo do arquivo CREATE TABLE UpStreamParam ( 'macaddress' CHAR(50), 'datats' BIGINT, 'cmtstimestamp' BIGINT, 'modulation' INT, 'chnlidx' INT, 'severity' BIGINT, 'rxpower' FLOAT, 'sigqnoise' ...

1 a resposta

Cluster do Hadoop - Preciso replicar meu código em todas as máquinas antes de executar o trabalh

Isso é o que me confunde, quando eu uso o exemplo de contagem de palavras, eu mantenho o código no mestre e deixo que ele faça coisas com os escravos e ele funciona bem Mas quando estou executando meu código, ele começa a falhar nos ...

5 a resposta

Erro Java do Hadoop: Exceção no encadeamento "main" java.lang.NoClassDefFoundError: WordCount (nome errado: org / myorg / WordCount)

Eu sou novo no hadoop. Eu segui o tutorial maichel-noll para configurar o hadoop no nó único. Tentei executar o programa WordCount. Este é o código que eu usei: import java.io.IOException; import java.util.StringTokenizer; ...

4 a resposta

como acessar e manipular os dados do arquivo pdf no Hadoop?

Eu quero ler o arquivo PDF usando o hadoop, como é possível? Eu sei apenas que o hadoop pode processar apenas arquivos txt, então existe uma maneira de analisar os arquivos PDF em tx Dê-me uma sugestão.

3 a resposta

Hadoop streaming - remova a guia à direita da saída do redutor

Eu tenho um trabalho de streaming hadoop cuja saída não contém pares de chave / valor. Você pode pensar nisso como pares de valor único ou pares somente de c...

4 a resposta

Descompacte os arquivos usando o streaming hadoop

Eu tenho muitos arquivos no HDFS, todos eles um arquivo zip com um arquivo CSV dentro dele. Eu estou tentando descompactar os arquivos para que eu possa exec...

0 a resposta

Deslocamento de byte do mapeador de streaming do Hadoop não sendo gerado

Estou executando um fluxo de trabalho do Hadoop e os deslocamentos de byte não estão sendo gerados como saída (chaves) do mapeador, como eu esperaria também....

1 a resposta

Como definir o número máximo preciso de tarefas em execução simultânea por nó no Hadoop 2.4.0 no Elastic MapReduce

De acordo com http://blog.cloudera.com/blog/2014/04/apache-hadoop-yarn-avoiding-6-time-consuming-gotchas/ [http://blog.cloudera.com/blog/2014/04/apache-hadoop-yarn-avoiding-6-time-consuming-gotchas/] , a fórmula para determinar o número de ...

4 a resposta

Executando um trabalho usando hadoop streaming e mrjob: PipeMapRed.waitOutputThreads (): subprocesso falhou com o código 1

Ei, sou relativamente novo no mundo do Big Data. Eu me deparei com este tutorial sobrehttp://musicmachinery.com/2011/09/04/how-to-process-a-million-songs-in-...