Spark - Summe der Zeilenwerte
Ich habe den folgenden DataFrame:
January | February | March
-----------------------------
10 | 10 | 10
20 | 20 | 20
50 | 50 | 50
Ich versuche, eine Spalte hinzuzufügen, die die Summe der Werte jeder Zeile ist.
January | February | March | TOTAL
----------------------------------
10 | 10 | 10 | 30
20 | 20 | 20 | 60
50 | 50 | 50 | 150
Soweit ich sehen kann, scheinen alle eingebauten Aggregatfunktionen für die Berechnung von Werten in einzelnen Spalten gedacht zu sein. Wie verwende ich spaltenübergreifende Werte pro Zeile (mit Scala)?
Ich bin so weit gekommen wie
val newDf: DataFrame = df.select(colsToSum.map(col):_*).foreach ...