PySpark: Mehrere Bedingungen in der when-Klausel
Ich möchte die Zellenwerte einer Datenrahmenspalte (Alter) ändern, in der sie derzeit leer ist, und ich würde dies nur tun, wenn eine andere Spalte (Überlebt) den Wert 0 für die entsprechende Zeile hat, in der sie für Alter leer ist. Wenn es in der Spalte "Überlebt" 1, in der Spalte "Alter" jedoch leer ist, behalte ich es als null bei.
Ich habe versucht, @ zu verwend&&
Operator, aber es hat nicht funktioniert. Hier ist mein Code:
tdata.withColumn("Age", when((tdata.Age == "" && tdata.Survived == "0"), mean_age_0).otherwise(tdata.Age)).show()
Irgendwelche Vorschläge, wie man damit umgeht? Vielen Dank
Fehlermeldung
SyntaxError: invalid syntax
File "<ipython-input-33-3e691784411c>", line 1
tdata.withColumn("Age", when((tdata.Age == "" && tdata.Survived == "0"), mean_age_0).otherwise(tdata.Age)).show()
^