PySpark: múltiples condiciones en la cláusula when
Me gustaría modificar los valores de celda de una columna de marco de datos (Edad) donde actualmente está en blanco y solo lo haría si otra columna (Sobrevivido) tiene el valor 0 para la fila correspondiente donde está en blanco para Edad. Si es 1 en la columna Sobrevivido pero en blanco en la columna Edad, lo mantendré como nulo.
Traté de usar&&
operador pero no funcionó. Aquí está mi código:
tdata.withColumn("Age", when((tdata.Age == "" && tdata.Survived == "0"), mean_age_0).otherwise(tdata.Age)).show()
¿Alguna sugerencia de cómo manejar eso? Gracias.
Mensaje de error:
SyntaxError: invalid syntax
File "<ipython-input-33-3e691784411c>", line 1
tdata.withColumn("Age", when((tdata.Age == "" && tdata.Survived == "0"), mean_age_0).otherwise(tdata.Age)).show()
^