¿Cómo convertir la columna con el tipo de cadena al formulario int en el marco de datos pyspark?

Tengo un marco de datos en pyspark. Algunas de sus columnas numéricas contienen 'nan', así que cuando estoy leyendo los datos y comprobando el esquema del marco de datos, esas columnas tendrán el tipo 'cadena'. Cómo puedo cambiarlos a tipo int. Reemplacé los valores 'nan' con 0 y nuevamente verifiqué el esquema, pero luego también muestra el tipo de cadena para esas columnas. Estoy siguiendo el siguiente código:

data_df = sqlContext.read.format("csv").load('data.csv',header=True, inferSchema="true")
data_df.printSchema()
data_df = data_df.fillna(0)
data_df.printSchema()

mis datos se ven así:

aquí las columnas 'Reproducciones' y 'borradores' que contienen valores enteros, pero debido al nan presente en estas columnas, se tratan como tipo de cadena.

Respuestas a la pregunta(3)

Su respuesta a la pregunta