Spark usando python: cómo resolver Stage x contiene una tarea de gran tamaño (xxx KB). El tamaño máximo recomendado de la tarea es de 100 KB.

Question

Mar 05, 2015, 02:10 PM

Spark usando python: cómo resolver Stage x contiene una tarea de gran tamaño (xxx KB). El tamaño máximo recomendado de la tarea es de 100 KB.

Acabo de crear una lista de Python derange(1,100000).

Utilizando SparkContext se realizaron los siguientes pasos:

a = sc.parallelize([i for i in range(1, 100000)])
b = sc.parallelize([i for i in range(1, 100000)])

c = a.zip(b)

>>> [(1, 1), (2, 2), -----]

sum  = sc.accumulator(0)

c.foreach(lambda (x, y): life.add((y-x)))

Lo que da la siguiente advertencia:

ARN TaskSetManager: la etapa 3 contiene una tarea de gran tamaño (4644 KB). El tamaño máximo de tarea recomendado es de 100 KB.

¿Cómo resolver esta advertencia? ¿Hay alguna forma de manejar el tamaño? Y también, ¿afectará la complejidad del tiempo en Big Data?

Respuestas a la pregunta(3)

Preguntas populares

0 la respuesta

Usar protocolos Swift con genéricos

0 la respuesta

¿Cómo utilizar la propiedad de la versión de bloqueo optimista de Hibernate en la parte frontal?

0 la respuesta

¿Hay alguna manera de encontrar la media aritmética "mejor" que sum () / N?

0 la respuesta

¿Hay alguna forma de verificar si el dispositivo iOS está bloqueado / desbloqueado?

0 la respuesta

Cómo determinar la latencia de un servidor remoto a través del navegador

¡Eres muy activo! ¡Es genial!

Spark usando python: cómo resolver Stage x contiene una tarea de gran tamaño (xxx KB). El tamaño máximo recomendado de la tarea es de 100 KB.

Respuestas a la pregunta(3)

Su respuesta a la pregunta

Preguntas populares