Resultados da pesquisa a pedido "hadoop"

1 a resposta

Estendendo o TableInputFormat do Hadoop para digitalizar com um prefixo usado para distribuição de chaves de registro de data e hora

5 a resposta

Mesclar arquivos CSV de saída do Spark com um único cabeçalho

Quero criar um pipeline de processamento de dados na AWS para, eventualmente, usar os dados processados para o Machine Learning. Eu tenho um script Scala que pega dados brutos do S3, os processa e os grava no HDFS ou mesmo no S3 comSpark-CSV. Eu ...

2 a resposta

Explodir a matriz de estrutura na colmeia

Esta é a tabela abaixo da colmeia

3 a resposta

Por que enviar trabalho para a mapreduce leva tanto tempo em geral?

Então, normalmente, para o trabalho de envio de cluster de 20 nós para processar 3 GB (200 divisões) de dados, leva cerca de 30 segundos e a execução real é ...

12 a resposta

Hbase conta rapidamente o número de linhas

No momento, eu implemento a contagem de linhas

5 a resposta

como matar trabalhos de hadoop

4 a resposta

Como eu construo / executo este programa simples de Mahout sem obter exceções?

2 a resposta

Copiando arquivo do HDFS para o computador local

4 a resposta

Escrevendo saída para diferentes pastas hadoop

Eu quero escrever dois tipos diferentes de saída do mesmo redutor, em dois diretórios diferentes.Eu sou capaz de usar o recurso multipleoutputs no hadoop par...

4 a resposta

Como funciona o algoritmo de classificação MapReduce?

Um dos principais exemplos usados ​​para demonstrar o poder do MapReduce é aBenchmark da Terasort. Estou tendo problemas para entender os fundamentos do algo...