Cómo escribir la salida de Spark Streaming en HDFS sin sobrescribir

Question

Jun 12, 2017, 08:19 AM

Cómo escribir la salida de Spark Streaming en HDFS sin sobrescribir

Después de un procesamiento, tengo un DStream [String, ArrayList [String]], así que cuando lo escribo en hdfs usando saveAsTextFile y después de cada lote sobrescribe los datos, así que cómo escribir un nuevo resultado al agregarlo a resultados anteriores

output.foreachRDD(r => {
  r.saveAsTextFile(path)
})

Editar :: Si alguien pudiera ayudarme a convertir la salida al formato avro y luego escribir a HDFS con un anexo

Respuestas a la pregunta(2)

Preguntas populares

0 la respuesta

Diferencia entre [corchetes] y * asterisco

0 la respuesta

¿Cómo hacer que el modelo angularJS ng-trabajo con objetos en elementos seleccionados?

0 la respuesta

Herencia de JavaScript: Object.create vs nuevo

0 la respuesta

Imagen de fondo para firefox en animaciones CSS3.

0 la respuesta

Diferencia en el comportamiento de conj en vectores y listas en Clojure

¡Eres muy activo! ¡Es genial!

Cómo escribir la salida de Spark Streaming en HDFS sin sobrescribir

Respuestas a la pregunta(2)

Su respuesta a la pregunta

Preguntas populares