¿Por qué las columnas cambian a nulables en Apache Spark SQL?

Question

Nov 15, 2016, 07:53 AM

apache-spark-sql apache-spark apache-spark-dataset

¿Por qué las columnas cambian a nulables en Apache Spark SQL?

Por que esnullable = true se usa después de ejecutar algunas funciones, aunque no haya valores NaN enDataFrame.

val myDf = Seq((2,"A"),(2,"B"),(1,"C"))
         .toDF("foo","bar")
         .withColumn("foo", 'foo.cast("Int"))

myDf.withColumn("foo_2", when($"foo" === 2 , 1).otherwise(0)).select("foo", "foo_2").show

Cuandodf.printSchema se llama ahoranullable estaránfalse para ambas columnas

val foo: (Int => String) = (t: Int) => {
    fooMap.get(t) match {
      case Some(tt) => tt
      case None => "notFound"
    }
  }

val fooMap = Map(
    1 -> "small",
    2 -> "big"
 )
val fooUDF = udf(foo)

myDf
    .withColumn("foo", fooUDF(col("foo")))
    .withColumn("foo_2", when($"foo" === 2 , 1).otherwise(0)).select("foo", "foo_2")
    .select("foo", "foo_2")
    .printSchema

Sin embargo ahoranullable estrue para al menos una columna que erafalse antes de. ¿Cómo se puede explicar esto?

Respuestas a la pregunta(2)

Preguntas populares

0 la respuesta

Políticas de Cognito / IAM y S3 Obtener objeto

0 la respuesta

Eficiente multiplicación de vectores de matriz 4x4 con SSE: producto de punto y adición horizontal: ¿cuál es el punto?

0 la respuesta

Patrón de fábrica en C #: ¿Cómo asegurar que una instancia de objeto solo pueda ser creada por una clase de fábrica?

0 la respuesta

Uso de íconos de bootstrap con button_to "delete" en rails 3

0 la respuesta

Validar el control de formulario basado en otros controles, acceder a otro control en la función de validación

¡Eres muy activo! ¡Es genial!

¿Por qué las columnas cambian a nulables en Apache Spark SQL?

Respuestas a la pregunta(2)

Su respuesta a la pregunta

Preguntas populares