Por que as colunas mudam para nulo no Apache Spark SQL?

Question

Nov 15, 2016, 07:53 AM

apache-spark-dataset apache-spark-sql apache-spark

Por que as colunas mudam para nulo no Apache Spark SQL?

Porque énullable = true usado após a execução de algumas funções, mesmo que não haja valores de NaN noDataFrame.

val myDf = Seq((2,"A"),(2,"B"),(1,"C"))
         .toDF("foo","bar")
         .withColumn("foo", 'foo.cast("Int"))

myDf.withColumn("foo_2", when($"foo" === 2 , 1).otherwise(0)).select("foo", "foo_2").show

Quandodf.printSchema é chamado agoranullable seráfalse para as duas colunas.

val foo: (Int => String) = (t: Int) => {
    fooMap.get(t) match {
      case Some(tt) => tt
      case None => "notFound"
    }
  }

val fooMap = Map(
    1 -> "small",
    2 -> "big"
 )
val fooUDF = udf(foo)

myDf
    .withColumn("foo", fooUDF(col("foo")))
    .withColumn("foo_2", when($"foo" === 2 , 1).otherwise(0)).select("foo", "foo_2")
    .select("foo", "foo_2")
    .printSchema

No entanto agora,nullable étrue por pelo menos uma coluna que foifalse antes. Como isso pode ser explicado?

questionAnswers(2)

Perguntas populares

0 a resposta

Existe alguma diferença entre expressões regulares em javascript e PHP?

0 a resposta

Preenchimento de alinhamento de estrutura, maior tamanho de preenchimento e ordem dos membros da estrutura

0 a resposta

Como redirecionar todos os logs do hibernate e spring para log4j2?

0 a resposta

passar dados para outro fragmento pela visualização deslizante com guia android studio, não botão

0 a resposta

Como remover todas as pastas do nome x dentro de um diretório usando o arquivo cmd / batch

Você é muito ativo! É ótimo!

Por que as colunas mudam para nulo no Apache Spark SQL?

questionAnswers(2)

yourAnswerToTheQuestion

Perguntas populares