_corrupt_record Fehler beim Einlesen einer JSON-Datei in Spark

Question

Feb 15, 2016, 01:34 PM

_corrupt_record Fehler beim Einlesen einer JSON-Datei in Spark

Ich habe diese JSON-Datei

{
    "a": 1, 
    "b": 2
}

, das mit der Python-Methode json.dump ermittelt wurde. Jetzt möchte ich diese Datei mit pyspark in einen DataFrame in Spark einlesen. Nach der Dokumentation mache ich das

sc = SparkContext ()

sqlc = SQLContext (sc)

df = sqlc.read.json ('my_file.json')

print df.show ()

Die print-Anweisung gibt dies jedoch wieder:

+---------------+
|_corrupt_record|
+---------------+
|              {|
|       "a": 1, |
|         "b": 2|
|              }|
+---------------+

Weiß jemand, was los ist und warum die Datei nicht richtig interpretiert wird?

Antworten auf die Frage(8)

Top Fragen

0 die antwort

Erstellen eines shared_ptr aus unique_ptr

0 die antwort

Ausführen einer Exe-Datei in der Kontrollleiste der C # .net-Anwendung

0 die antwort

Ändern der Eigenschaften (Zeitzone) von wiederkehrenden Terminen in Outlook 2010 VBA

0 die antwort

Propel ORM - Verknüpfen von nicht verwandten Tabellen

0 die antwort

Laden Sie Videodateien über PHP hoch, speichern Sie sie in einem geeigneten Ordner und haben Sie einen Datenbankeintrag

Du bist sehr aktiv! Es ist großartig!

_corrupt_record Fehler beim Einlesen einer JSON-Datei in Spark

Antworten auf die Frage(8)

Ihre Antwort auf die Frage

Top Fragen