Resultados da pesquisa a pedido "hadoop-partitioning"
No Apache Spark, por que o RDD.union não preserva o particionador?
Como todos sabem, os particionadores do Spark têm um enorme impacto no desempenho de qualquer operação "ampla", portanto, geralmente é personalizado nas operações. Eu estava experimentando o seguinte código: val rdd1 = sc.parallelize(1 to ...
Novo usuário SSH hadoop
Instalação do hadoop no cluster de nó único, alguma ideia porque precisamos criar o seguintePor que precisamos de acesso SSH para um novo usuário?Por que dev...
DiskErrorException na máquina escrava - multinode Hadoop
Eu estou tentando processar arquivos XML do hadoop, eu tenho seguinte erro em invocar o trabalho de contagem de palavras em arquivos XML.
Como especificar o particionador para streaming de hadoop
Eu tenho um particionador personalizado como abaixo: