Apache spark que trata con declaraciones de casos

Question

Oct 11, 2016, 06:27 PM

pyspark-sql rdd apache-spark spark-dataframe pyspark

Apache spark que trata con declaraciones de casos

Estoy tratando de transformar el código SQL en código PySpark y encontré algunas declaraciones SQL. No sé cómo abordar las declaraciones de casos en pyspark? Estoy planeando crear un RDD y luego usar rdd.map y luego hacer algunas verificaciones lógicas. ¿Ese es el enfoque correcto? ¡Por favor ayuda!

Básicamente, necesito pasar por cada línea en el RDD o DF y, en función de alguna lógica, necesito editar uno de los valores de la columna.

     case  
               when (e."a" Like 'a%' Or e."b" Like 'b%') 
                And e."aa"='BW' And cast(e."abc" as decimal(10,4))=75.0 Then 'callitA'

               when (e."a" Like 'b%' Or e."b" Like 'a%') 
                And e."aa"='AW' And cast(e."abc" as decimal(10,4))=75.0 Then 'callitB'

else

'CallitC'