Histogramm mit Spark-DataFrame-Spalte erstellen
Ich versuche, ein Histogramm mit einer Spalte aus einem Datenrahmen zu erstellen, der wie folgt aussieht:
DataFrame[C0: int, C1: int, ...]
Wenn ich ein Histogramm mit der Spalte C1 erstellen würde, was soll ich tun?
inige Dinge, die ich versucht habe, sind
df.groupBy("C1").count().histogram()
df.C1.countByValue()
Was nicht funktioniert, weil die Datentypen nicht übereinstimmen.