Selecionando apenas nomes de colunas numéricas / de seqüência de caracteres de um Spark DF no pyspark

Question

May 19, 2017, 11:43 AM

Selecionando apenas nomes de colunas numéricas / de seqüência de caracteres de um Spark DF no pyspark

Eu tenho um SparkDataFrame no pyspark (2.1.0) e estou procurando obter apenas os nomes de colunas numéricas ou apenas colunas de seqüência de caracteres.

Por exemplo, este é o esquema do meu DF:

root
 |-- Gender: string (nullable = true)
 |-- SeniorCitizen: string (nullable = true)
 |-- MonthlyCharges: double (nullable = true)
 |-- TotalCharges: double (nullable = true)
 |-- Churn: string (nullable = true)

Isto é o que eu preciso:

num_cols = [MonthlyCharges, TotalCharges]
str_cols = [Gender, SeniorCitizen, Churn]

Como posso fazer isso? Obrigado!

questionAnswers(1)

Perguntas populares

0 a resposta

WPF com Unity Container - Como registrar e resolver ViewModels para Views

0 a resposta

O flexslider border-radius não quebra a imagem no Chrome, Safari, mas no Firefox

0 a resposta

Por que um +++++ b funciona?

0 a resposta

Obtém o tamanho real de um conteúdo JFrame

0 a resposta

Como posso obter corretamente o caminho do cartão SD externo?

Você é muito ativo! É ótimo!

Selecionando apenas nomes de colunas numéricas / de seqüência de caracteres de um Spark DF no pyspark

questionAnswers(1)

yourAnswerToTheQuestion

Perguntas populares