Seleccionar solo nombres de columnas numéricas / de cadena de un Spark DF en pyspark

Question

May 19, 2017, 11:43 AM

Seleccionar solo nombres de columnas numéricas / de cadena de un Spark DF en pyspark

Tengo un SparkDataFrame en pyspark (2.1.0) y estoy buscando obtener solo los nombres de columnas numéricas o columnas de cadena.

Por ejemplo, este es el esquema de mi DF:

root
 |-- Gender: string (nullable = true)
 |-- SeniorCitizen: string (nullable = true)
 |-- MonthlyCharges: double (nullable = true)
 |-- TotalCharges: double (nullable = true)
 |-- Churn: string (nullable = true)

Esto es lo que necesito:

num_cols = [MonthlyCharges, TotalCharges]
str_cols = [Gender, SeniorCitizen, Churn]

¿Cómo puedo hacerlo? ¡Gracias!

Deja tu comentario

Respuestas a la pregunta(1)

Su respuesta a la pregunta

Preguntas populares

0 la respuesta

Symfony2 Route {_locale} requisitos globales

0 la respuesta

¿Cuál es la diferencia entre tempfile y mktemp?

0 la respuesta

Giro de socket asíncrono Paralelo y no solo concurrente en aplicaciones muy intensivas usando TPL

0 la respuesta

Cuál es la mejor manera de imprimir una tabla con delimitadores en Python

0 la respuesta

Propiedad vinculante con ViewModel padre