¿La opción ignorar de la función jdbc de Pyspark DataFrameWriter ignora toda la transacción o solo ofende las filas?

Question

Feb 13, 2017, 10:26 PM

pyspark apache-spark jdbc mysql apache-spark-sql

¿La opción ignorar de la función jdbc de Pyspark DataFrameWriter ignora toda la transacción o solo ofende las filas?

El PysparkDataFrameWriter la clase tiene unjdbc función para escribir un marco de datos en sql. Esta función tiene un--ignore opción que dice la documentación:

Ignore silenciosamente esta operación si ya existen datos.

Pero, ¿ignorará toda la transacción o solo ignorará la inserción de las filas que son duplicadas? ¿Y si tuviera que combinar--ignore con el--append ¿bandera? ¿Cambiaría el comportamiento?