Entrada e saída de dados do Elastic MapReduce HDFS

Question

Oct 09, 2011, 07:42 AM

Entrada e saída de dados do Elastic MapReduce HDFS

Escrevi um programa Hadoop que requer um determinado layout no HDFS e, posteriormente, preciso retirar os arquivos do HDFS. Ele funciona na minha configuração Hadoop de nó único e estou ansioso para fazê-lo funcionar em dezenas de nós no Elastic MapReduc

O que eu tenho feito é algo assim:

./elastic-mapreduce --create --alive
JOBID="j-XXX" # output from creation
./elastic-mapreduce -j $JOBID --ssh "hadoop fs -cp s3://bucket-id/XXX /XXX"
./elastic-mapreduce -j $JOBID --jar s3://bucket-id/jars/hdeploy.jar --main-class com.ranjan.HadoopMain --arg /XXX

Isso é assíncrono, mas quando o trabalho estiver concluído, eu posso fazer isso

./elastic-mapreduce -j $JOBID --ssh "hadoop fs -cp /XXX s3://bucket-id/XXX-output"
./elastic-mapreduce -j $JOBID --terminate

Enquanto issotipo d funciona, mas é desajeitado e não é o que eu gostaria. Existe uma maneira mais limpa de fazer isso?

Obrigado

questionAnswers(2)

Perguntas populares

0 a resposta

Procurando por um contêiner de dados com a indexação O (1) e a inserção e exclusão de O (log (n))

0 a resposta

Funções variáveis com namespaces em PHP

0 a resposta

Criando um objeto UITouch

0 a resposta

Algoritmo para correspondência de padrões lineares?

0 a resposta

Contador JS atualizando continuamente

Você é muito ativo! É ótimo!

Entrada e saída de dados do Elastic MapReduce HDFS

questionAnswers(2)

yourAnswerToTheQuestion

Perguntas populares