pyspark: el objeto 'PipelinedRDD' no es iterable

Recibo este error pero no sé por qué. Básicamente me estoy equivocando de este código:

    a = data.mapPartitions(helper(locations))

donde data es un RDD y mi ayudante se define como:

    def helper(iterator, locations): 
        for x in iterator:
            c = locations[x]
            yield c

(las ubicaciones son solo una serie de puntos de datos) No veo cuál es el problema, pero tampoco soy el mejor en pyspark, ¿alguien puede decirme por qué obtengo el objeto 'PipelinedRDD'?

Respuestas a la pregunta(2)

Su respuesta a la pregunta