Resultados da pesquisa a pedido "hadoop-partitioning"

1 a resposta

No Apache Spark, por que o RDD.union não preserva o particionador?

Como todos sabem, os particionadores do Spark têm um enorme impacto no desempenho de qualquer operação "ampla", portanto, geralmente é personalizado nas operações. Eu estava experimentando o seguinte código: val rdd1 = sc.parallelize(1 to ...

4 a resposta

Novo usuário SSH hadoop

Instalação do hadoop no cluster de nó único, alguma ideia porque precisamos criar o seguintePor que precisamos de acesso SSH para um novo usuário?Por que dev...

1 a resposta

DiskErrorException na máquina escrava - multinode Hadoop

Eu estou tentando processar arquivos XML do hadoop, eu tenho seguinte erro em invocar o trabalho de contagem de palavras em arquivos XML.

2 a resposta

Como especificar o particionador para streaming de hadoop

Eu tenho um particionador personalizado como abaixo: