¿Cómo funciona la partición en Spark?

Question

Oct 14, 2014, 09:02 PM

Estoy tratando de entender cómo se realiza la partición en Apache Spark. ¿Pueden ayudarme por favor?

Aquí está el escenario:

un maestro y dos nodos con 1 núcleo cada unoun archivocount.txt de 10 MB de tamaño

¿Cuántas particiones crea lo siguiente?

rdd = sc.textFile(count.txt)

¿El tamaño del archivo tiene algún impacto en el número de particiones?

Respuestas a la pregunta(1)

objetivo - C: Cargando imagen desde URL?

Para bucles con pandas: ¿cuándo debería importarme?

CSS:: foco de elementos en contenteditable

@AssociationOverride y @AttributeOverride en la nueva Doctrine 2.3

Pasando argumentos por referencia