Establecer variables de entorno del código de Python para la chispa
He configurado las variables de entorno en Mac OS para ejecutarpyspark
export SPARK_HOME=/Users/devesh/Downloads/spark-1.5.1-bin-hadoop2.6
export PYTHONPATH=$SPARK_HOME/python/:$PYTHONPATH
export PYTHONPATH=$SPARK_HOME/python/lib/py4j-0.8.2.1-src.zip:$PYTHONPATH
Las líneas anteriores hacen el trabajo por mí.
Estoy tratando de replicar los comandos anteriores en python usando las siguientes líneas de código python
os.environ['SPARK_HOME']="/Users/devesh/Downloads/spark-1.5.1-bin-hadoop2.6"
spark_home=os.environ.get('SPARK_HOME',None)
sys.path.append("/Users/devesh/Downloads/spark-1.5.1-bin-hadoop2.6/python/")
sys.path.insert(0,os.path.join(spark_home,'py4j-0.8.2.1-src.zip'))
Pero no está funcionando. Por favor dime que estoy haciendo mal?