Sobrescribir solo algunas particiones en un conjunto de datos de chispa particionada
¿Cómo podemos sobrescribir un conjunto de datos particionado, pero solo las particiones que vamos a cambiar? Por ejemplo, volver a calcular el trabajo diario de la semana pasada y solo sobrescribir la semana pasada de datos.
l comportamiento predeterminado de Spark es sobrescribir toda la tabla, incluso si solo se van a escribir algunas particiones.