Como executar operações matemáticas com duas colunas no dataframe usando o pyspark
Eu tenho dataframe com três colunas "x", "y" e "z"
x y z
bn 12452 221
mb 14521 330
pl 12563 160
lo 22516 142
Eu preciso criar uma outra coluna que é derivada por esta fórmula
(m = z / y+z)
Portanto, os novos quadros de dados devem ter a seguinte aparência:
x y z m
bn 12452 221 .01743
mb 14521 330 .02222
pl 12563 160 .01257
lo 22516 142 .00626