pyspark: el objeto 'PipelinedRDD' no es iterable

Question

Apr 19, 2016, 06:03 AM

pyspark: el objeto 'PipelinedRDD' no es iterable

Recibo este error pero no sé por qué. Básicamente me estoy equivocando de este código:

    a = data.mapPartitions(helper(locations))

donde data es un RDD y mi ayudante se define como:

    def helper(iterator, locations): 
        for x in iterator:
            c = locations[x]
            yield c

(las ubicaciones son solo una serie de puntos de datos) No veo cuál es el problema, pero tampoco soy el mejor en pyspark, ¿alguien puede decirme por qué obtengo el objeto 'PipelinedRDD'?

Respuestas a la pregunta(2)

Preguntas populares

0 la respuesta

Recuperar todas las rutas en una jerarquía de clases OWL con SPARQL y Jena

0 la respuesta

Jython: Cómo usar el archivo "jython-2.7-b1.jar"

0 la respuesta

habilitar la resolución previa de DNS y la conexión previa de TCP

0 la respuesta

Secuencias de comandos con Scala: ¿Cómo lanzar una secuencia de comandos sin compilar?

0 la respuesta

navigator.connection.type no funciona incluso si el dispositivo está listo * o * el dispositivo nunca está listo

¡Eres muy activo! ¡Es genial!

pyspark: el objeto &#39;PipelinedRDD&#39; no es iterable

Respuestas a la pregunta(2)

Su respuesta a la pregunta

Preguntas populares

pyspark: el objeto 'PipelinedRDD' no es iterable