Resultados da pesquisa a pedido "amazon-emr"

7 a resposta

Como manipular campos entre aspas (CSV) na importação de dados do S3 para o DynamoDB usando EMR / Hive

Eu estou tentando usar o EMR / Hive para importar dados do S3 para o DynamoDB. Meu arquivo CSV tem campos que estão entre aspas duplas e separados por vírgul...

2 a resposta

Pig UDF em execução no EMR do AWS com java.lang.NoClassDefFoundError: org / apache / pig / LoadFunc

Estou desenvolvendo um aplicativo que tenta ler o arquivo de log armazenado em dólares do S3 e analisá-lo usando o Elastic MapReduce. Atual o arquivo de log ...

1 a resposta

hadoop copiando de hdfs para S3

Concluí com sucesso um trabalho de vetorização no Amazon EMR (usandoMahout no Elastic MapReduce como referência). Agora quero copiar os resultados do HDFS pa...

1 a resposta

Hadoop não-divisível TextInputFormat

1 a resposta

Amazon Elastic MapReduce - inserção em massa do S3 para o DynamoDB é incrivelmente lenta

2 a resposta

Podemos adicionar mais instâncias do Amazon Elastic Mapreduce em instâncias existentes do Amazon Elastic Mapreduce?

Eu sou novo no Amazon Services e enfrento alguns problemas.Suponha que estou executando algum fluxo de trabalho no Amazon Elastic Mapreduce com um total de 3...

2 a resposta

Amazon MapReduce melhores práticas para análise de logs

Estou analisando os logs de acesso gerados pelo Apache, Nginx, Darwin (servidor de streaming de vídeo) e agregando estatísticas para cada arquivo entregue por data / referenciador / agente do usuário. Toneladas de logs gerados a cada hora e ...

10 a resposta

@ Pasta não será excluída no Amazon S3

Estou tentando excluir uma pasta criada como resultado de um trabalho do MapReduce. Outros arquivos no intervalo são excluídos, mas essa pasta não é excluída. Quando tento excluí-lo do console, a barra de progresso ao lado de seu status ...

4 a resposta

Como usar o Hadoop Streaming com arquivos de sequência compactados por LZO?

Estou tentando brincar com o conjunto de dados de ngrams do Google usando o Elastic Map Reduce da Amazon. Há um conjunto de dados público em http://aws.amazon.com/datasets/8172056142375670 [http://aws.amazon.com/datasets/8172056142375670], e ...