Sollten Hadoop-Cluster auf identischer Hardware ausgeführt werden?

Ich erinnere mich, dass ich irgendwo gelesen habe, dass sich die Leistung von Hadoop erheblich verschlechtert, wenn die Maschinen, auf denen es läuft, sehr unterschiedlich sind, aber ich kann diesen Kommentar anscheinend nicht mehr finden. Ich erwäge, einen Hadoop-Cluster auf einem Array von VMs auszuführen, das nicht direkt von meiner Gruppe verwaltet wird, und ich muss wissen, ob dies eine Anforderung ist, die ich in meine Anforderung aufnehmen sollte.

Sollte ich also darauf bestehen, dass alle meine Computer identische Hardware haben, oder ist es in Ordnung, auf verschiedenen Computern mit unterschiedlichen Hardwarekonfigurationen zu arbeiten?

Vielen Dank.

Antworten auf die Frage(2)

Ihre Antwort auf die Frage