Suchergebnisse für Anfrage "hadoop-partitioning"

1 die antwort

DiskErrorException auf Slave-Maschine - Hadoop Multinode

Ich versuche, XML-Dateien von Hadoop zu verarbeiten. Beim Aufrufen des Auftrags zur Wortzählung für XML-Dateien ist folgender Fehler aufgetreten.

2 die antwort

In Apache Spark, warum behält RDD.union den Partitioner nicht bei?

Wie jeder weiß, haben Partitionierer in Spark enorme Auswirkungen auf die Leistung von "Wide" -Operationen, daher werden sie normalerweise in Operationen angepasst. Ich habe mit folgendem Code experimentiert: val rdd1 = sc.parallelize(1 to ...

2 die antwort

So legen Sie den Partitionierer für das Hadoop-Streaming fest

Ich habe einen benutzerdefinierten Partitionierer wie folgt:

TOP-Veröffentlichungen

4 die antwort

Neuer Benutzer SSH hadoop