(nulo) entrada en la cadena de comando excepción en saveAsTextFile () en Pyspark
Estoy trabajando en PySpark en un cuaderno Jupyter (Python 2.7) en Windows 7. Tengo un RDD de tipopyspark.rdd.PipelinedRDD
llamadoidSums
. Al intentar ejecutaridSums.saveAsTextFile("Output")
, Recibo el siguiente error:
Py4JJavaError: An error occurred while calling o834.saveAsTextFile.
: org.apache.spark.SparkException: Job aborted due to stage failure: Task 1 in stage 33.0 failed 1 times, most recent failure: Lost task 1.0 in stage 33.0 (TID 131, localhost): java.io.IOException: (null) entry in command string: null chmod 0644 C:\Users\seride\Desktop\Experiments\PySpark\Output\_temporary\0\_temporary\attempt_201611231307_0033_m_000001_131\part-00001
No debería haber ningún problema con el objeto RDD, en mi opinión, porque puedo ejecutar otras acciones sin error, p. ejecutandoidSums.collect()
produce la salida correcta.
Además, elOutput
se crea el directorio (con todos los subdirectorios) y el archivopart-00001
se crea, pero tiene 0 bytes.