Resultados da pesquisa a pedido "hadoop"
Por que ele continua mostrando erro reprovado ao executar hadoop (ou comando dfs)
Eu instaleihadoop-2.0.0-alpha, mas sempre que eu executo um comando, ele me dá erros de depreciação (embora pareça estar rodando sem problema)
Como lidar com geração de id em um cluster de hadoop?
Eu estou construindo um dicionário em um cluster de hadoop e preciso gerar umnumérico id para cada token. Como devo fazer isso?
Onde o Sort é usado na fase do MapReduce e por quê?
Eu sou novo no hadoop aqui. Não está claro por que precisamos ser capazes de classificar por chaves ao usar hadoop mapreduce? Após a fase de mapeamento, prec...
Hive JDBC getConnection não retorna
Estou seguindo o tutorial do JDBC da colmeia. Eu não consegui fazê-lo funcionar. Quando ele tenta obter a conexão, simplesmente pára. Também não informa qual...
Junção de dois conjuntos de dados no Mapreduce / Hadoop
Alguém sabe como implementar a operação de associação natural entre dois conjuntos de dados no Hadoop?Mais especificamente, eis o que preciso exatamente faze...
Vetorização no Apache Mahout
Eu sou novo no Mahout. Eu tenho um requisito para converter um arquivo de texto em um vetor para classificação no estágio posterior.Alguém poderia lançar alg...
Como manter o arquivo de log do trabalho PIG quando for bem-sucedido.
Percebi que quando há um erro na execução de um script PIG, um log é gerado e mantido. Mas quando não há erro, o arquivo de log é removido. Existe uma maneir...
Convertendo CSV para SequenceFile
Eu tenho um arquivo CSV que gostaria de converter em um SequenceFile, que eu usaria para criar NamedVectors para usar em um trabalho de cluster. Eu tenho usa...