PySpark-Pakete importieren
Ich habe das @ heruntergeladgraphframes
Paket (vonHie) und auf meiner lokalen Festplatte gespeichert. Jetzt möchte ich es benutzen. Also benutze ich den folgenden Befehl:
IPYTHON_OPTS="notebook --no-browser" pyspark --num-executors=4 --name gorelikboris_notebook_1 --py-files ~/temp/graphframes-0.1.0-spark1.5.jar --jars ~/temp/graphframes-0.1.0-spark1.5.jar --packages graphframes:graphframes:0.1.0-spark1.5
Alle Pyspark-Funktionen funktionieren wie erwartet, mit Ausnahme der neuengraphframes
Paket: wann immer ich versucheimport graphframes
Bekomme ich einImportError
. Wenn ich @ untersucsys.path
, Ich kann die folgenden zwei Pfade sehen:
/tmp/spark-1eXXX/userFiles-9XXX/graphframes_graphframes-0.1.0-spark1.5.jar
und/tmp/spark-1eXXX/userFiles-9XXX/graphframes-0.1.0-spark1.5.jar
, diese Dateien existieren jedoch nicht. Darüber hinaus ist das/tmp/spark-1eXXX/userFiles-9XXX/
Verzeichnis ist leer.
Was vermisse ich