Resultados da pesquisa a pedido "hadoop-partitioning"

Popular Novo Não responde

apache-spark partitioning

No Apache Spark, por que o RDD.union não preserva o particionador?

Como todos sabem, os particionadores do Spark têm um enorme impacto no desempenho de qualquer operação "ampla", portanto, geralmente é personalizado nas operações. Eu estava experimentando o seguinte código: val rdd1 = sc.parallelize(1 to ...

hadoop-plugins hadoop-streaming hadoop

Novo usuário SSH hadoop

Instalação do hadoop no cluster de nó único, alguma ideia porque precisamos criar o seguintePor que precisamos de acesso SSH para um novo usuário?Por que dev...

mapreduce hadoop hadoop-streaming hadoop-plugins

DiskErrorException na máquina escrava - multinode Hadoop

Eu estou tentando processar arquivos XML do hadoop, eu tenho seguinte erro em invocar o trabalho de contagem de palavras em arquivos XML.

Tags populares

setup.exe ddev multicore setneedsdisplay cat http-live-streaming jsni monotouch.dialog pagedown compressed-folder urlopen autograd serverless runc klist fractals indy-9 kdiff3 controllers jurassic

hadoop mapreduce hadoop-streaming

Como especificar o particionador para streaming de hadoop

Eu tenho um particionador personalizado como abaixo: