KeyError: 'SPARK_HOME' in Pyspark auf Jupyter auf Google-Cloud-DataProc

Question

Jul 29, 2016, 09:28 AM

KeyError: 'SPARK_HOME' in Pyspark auf Jupyter auf Google-Cloud-DataProc

Beim Versuch, eine SparkDF (Test) anzuzeigen, erhalte ich einen KeyError (siehe unten). Wahrscheinlich stimmt etwas mit der Funktion nicht, die ich zuvor verwendet habeTest.show(3).

Der KeyError sagt: KeyError: 'SPARK_HOME'. Ich gehe davon aus, dass SPARK_HOME für den Master und / oder die Worker nicht definiert ist. Gibt es eine Möglichkeit, das SPARK_HOME-Verzeichnis für beide automatisch anzugeben? Vorzugsweise mit einer Initialisierungsaktion.

Py4JJavaErrorTraceback (letzter Aufruf zuletzt) in () ----> 1 Test.show (3)

/usr/lib/spark/python/pyspark/sql/dataframe.py in show(self, n, truncate)
    255         +---+-----+
    256         """
--> 257         print(self._jdf.showString(n, truncate))
    258 
    259     def __repr__(self):

...

    raise KeyError(key)
KeyError: 'SPARK_HOME'

Antworten auf die Frage(2)

Top Fragen

0 die antwort

RESTful-Ressource nicht gefunden. 404 oder 204? Jersey gibt 204 zurück, wenn null vom Handler zurückgegeben wird

0 die antwort

Ein QWidget wie QTextEdit, das seine Höhe automatisch an den Inhalt anpasst?

0 die antwort

Warum ist der Hintergrund von ProgressDialog nicht transparent?

0 die antwort

Zwischenspeichern mit NSURLSession und NSURLCache. Funktioniert nicht

0 die antwort

Python-Code zum Erstellen einer kennwortverschlüsselten Zip-Datei? [Duplikat]

Du bist sehr aktiv! Es ist großartig!

KeyError: &#39;SPARK_HOME&#39; in Pyspark auf Jupyter auf Google-Cloud-DataProc

Antworten auf die Frage(2)

Ihre Antwort auf die Frage

Top Fragen

KeyError: 'SPARK_HOME' in Pyspark auf Jupyter auf Google-Cloud-DataProc