Impulsar spark.yarn.executor.memoryOverhead

Question

Jun 29, 2016, 03:58 PM

pyspark amazon-web-services apache-spark amazon-emr emr

Impulsar spark.yarn.executor.memoryOverhead

Estoy tratando de ejecutar un trabajo (py) Spark en EMR que procesará una gran cantidad de datos. Actualmente mi trabajo falla con el siguiente mensaje de error:

Reason: Container killed by YARN for exceeding memory limits.
5.5 GB of 5.5 GB physical memory used.
Consider boosting spark.yarn.executor.memoryOverhead.

Así que busqué en Google cómo hacer esto, y descubrí que debería transmitir elspark.yarn.executor.memoryOverhead parámetro con la bandera --conf. Lo estoy haciendo de esta manera:

aws emr add-steps\
--cluster-id %s\
--profile EMR\
--region us-west-2\
--steps Name=Spark,Jar=command-runner.jar,\
Args=[\
/usr/lib/spark/bin/spark-submit,\
--deploy-mode,client,\
/home/hadoop/%s,\
--executor-memory,100g,\
--num-executors,3,\
--total-executor-cores,1,\
--conf,'spark.python.worker.memory=1200m',\
--conf,'spark.yarn.executor.memoryOverhead=15300',\
],ActionOnFailure=CONTINUE" % (cluster_id,script_name)\

Pero cuando vuelvo a ejecutar el trabajo, sigue apareciendo el mismo mensaje de error, con el5.5 GB of 5.5 GB physical memory used, lo que implica que mi memoria no aumentó ... ¿Alguna pista sobre lo que estoy haciendo mal?

EDITAR

Aquí hay detalles sobre cómo inicialmente creo el clúster:

aws emr create-cluster\
--name "Spark"\
--release-label emr-4.7.0\
--applications Name=Spark\
--bootstrap-action Path=s3://emr-code-matgreen/bootstraps/install_python_modules.sh\
--ec2-attributes KeyName=EMR2,InstanceProfile=EMR_EC2_DefaultRole\
--log-uri s3://emr-logs-zerex\
--instance-type r3.xlarge\
--instance-count 4\
--profile EMR\
--service-role EMR_DefaultRole\
--region us-west-2'

Gracias.

Deja tu comentario