¿Cómo asignar y usar encabezados de columna en Spark?

Question

Apr 13, 2016, 10:07 PM

multiple-columns python apache-spark pyspark hadoop

¿Cómo asignar y usar encabezados de columna en Spark?

Estoy leyendo un conjunto de datos como a continuación.

 f = sc.textFile("s3://test/abc.csv")

Mi archivo contiene más de 50 campos y quiero asignar encabezados de columna a cada uno de los campos para hacer referencia más adelante en mi secuencia de comandos.

¿Cómo hago eso en PySpark? ¿Es DataFrame la manera de ir aquí?

PD: Newbie to Spark.

Respuestas a la pregunta(3)

Preguntas populares

0 la respuesta

¿Cómo hacer que una función async-signal-safe?

0 la respuesta

¿Cómo puedo evitar el uso de Settings.bundle en Release build v.s. Depurar compilación?

0 la respuesta

cuFFT y arroyos

0 la respuesta

PHP: file_get_contents ($ loc) falla

0 la respuesta

¿Cómo truncar todas las tablas de usuario?

¡Eres muy activo! ¡Es genial!

¿Cómo asignar y usar encabezados de columna en Spark?

Respuestas a la pregunta(3)

Su respuesta a la pregunta

Preguntas populares