¿La opción ignorar de la función jdbc de Pyspark DataFrameWriter ignora toda la transacción o solo ofende las filas?
El PysparkDataFrameWriter
la clase tiene unjdbc
función para escribir un marco de datos en sql. Esta función tiene un--ignore
opción que dice la documentación:
Ignore silenciosamente esta operación si ya existen datos.
Pero, ¿ignorará toda la transacción o solo ignorará la inserción de las filas que son duplicadas? ¿Y si tuviera que combinar--ignore
con el--append
¿bandera? ¿Cambiaría el comportamiento?