ETL y análisis de archivos CSV en Cloud Dataflow

Soy nuevo en el flujo de datos en la nube y Java, así que espero que esta sea la pregunta correcta.

Tengo un archivo csv con n número de columnas y filas que podrían ser una cadena, un entero o una marca de tiempo. ¿Necesito crear una nueva PCollection para cada columna?

La mayor parte de la documentación que he encontrado en ejemplos es similar a:

PCollection<String> data = p.apply(TextIO.Read.from("gs://abc/def.csv"));

Pero para mí no tiene sentido importar un archivo csv completo como una cadena. ¿Qué me estoy perdiendo aquí y cómo debo configurar mis PCollections?

Respuestas a la pregunta(2)

Su respuesta a la pregunta