Erstellen Sie einen Datenrahmen in Pyspark, der eine einzelne Spalte mit Tupeln enthält

Question

Jul 08, 2016, 11:51 AM

apache-spark-sql pyspark dataframe apache-spark

Erstellen Sie einen Datenrahmen in Pyspark, der eine einzelne Spalte mit Tupeln enthält

Ich habe eine RDD, die Folgendes enthält: [('Spalte 1', Wert), ('Spalte 2', Wert), ('Spalte 3', Wert), ..., ('Spalte 100', Wert)] . Ich möchte einen Datenrahmen erstellen, der eine einzelne Spalte mit Tupeln enthält.

Der nächste, den ich bekommen habe, ist:

schema = StructType((StructField("char", StringType(), False), (StructField("count", IntegerType(), False))))
    my_udf = udf(lambda w, c: (w,c), schema)

und dan

df.select(my_udf('char', 'int').alias('char_int'))

, aber dies erzeugt einen Datenrahmen mit einer Spalte von Listen, nicht Tupeln.

Antworten auf die Frage(2)

Top Fragen

0 die antwort

Namespace-Änderung - Es wurden mehrere Typen gefunden, die dem Controller mit dem Namen "Home" entsprechen.

0 die antwort

Klassenpfad einschließlich JAR innerhalb eines JAR

0 die antwort

ADB Befehl zum Einstellen der Lautstärke?

0 die antwort

NSURLSession mit NSBlockOperation und Warteschlangen

0 die antwort

Winkel zwischen zwei Vektoren matlab

Du bist sehr aktiv! Es ist großartig!

Erstellen Sie einen Datenrahmen in Pyspark, der eine einzelne Spalte mit Tupeln enthält

Antworten auf die Frage(2)

Ihre Antwort auf die Frage

Top Fragen