obtenga los primeros N elementos de la columna ArrayType del marco de datos en pyspark
Tengo un marco de datos de chispa con filas como -
1 | [a, b, c]
2 | [d, e, f]
3 | [g, h, i]
Ahora quiero conservar solo los primeros 2 elementos de la columna de matriz.
1 | [a, b]
2 | [d, e]
3 | [g, h]
¿Cómo se puede lograr eso?
Nota: recuerde que no estoy extrayendo un solo elemento de matriz aquí, sino una parte de la matriz que puede contener múltiples elementos.