Suchergebnisse für Anfrage "amazon-emr"

1 die antwort

Amazon Elastic MapReduce - Masseneinfügung von S3 nach DynamoDB ist unglaublich langsam

1 die antwort

Hadoop Nicht teilbares TextInputFormat

1 die antwort

HADOOP Kopieren von HDFS nach S3

Ich habe den Mahout - Vektorisierungsjob bei Amazon EMR erfolgreich abgeschlossen (mitMahout auf Elastic MapReduce als Referenz). Jetzt möchte ich die Ergebn...

TOP-Veröffentlichungen

1 die antwort

AWS EMR führt ein "Bootstrap" -Skript auf allen bereits laufenden Maschinen im Cluster durch.

Ich habe einen EMR-Cluster, der rund um die Uhr läuft. Ich kann es nicht ausschalten und das neue starten. Was ich tun möchte, ist so etwas wie eine Bootstrap-Aktion auf dem bereits laufenden Cluster auszuführen, vorzugsweise mit Python und Boto ...

2 die antwort

Können wir einer vorhandenen Amazon Elastic Mapreduce-Instanz weitere Amazon Elastic Mapreduce-Instanzen hinzufügen?

2 die antwort

Pig-UDF unter AWS EMR mit java.lang.NoClassDefFoundError: org / apache / pig / LoadFunc

2 die antwort

Wie liest MapReduce aus mehreren Eingabedateien?

2 die antwort

So starten und konfigurieren Sie einen EMR-Cluster mit boto

Ich versuche, mit boto einen Cluster zu starten und einen Job auszuführen. Ich finde viele Beispiele für die Erstellung von job_flows. Aber ich kann nicht für das Leben von mir ein Beispiel finden, das zeigt: So definieren Sie den zu ...

2 die antwort

Warum weist Yarn on EMR nicht allen Knoten die Ausführung von Spark-Jobs zu?

Ich arbeite mit Apache Spark in Amazon Elastic Map Reduce (EMR). Derzeit arbeite ich mit emr-4.1.0, das Amazon Hadoop 2.6.0 und Spark 1.5.0 enthält. Wenn ich den Job starte, hat YARN alle Worker-Knoten korrekt dem Spark-Job zugewiesen (mit ...

4 die antwort

Boosting spark.yarn.executor.memoryOverhead

Ich versuche, einen (py) Spark-Job für EMR auszuführen, der eine große Datenmenge verarbeitet. Derzeit schlägt mein Job mit der folgenden Fehlermeldung fehl: Reason: Container killed by YARN for exceeding memory limits. 5.5 GB of 5.5 ...