¿Cómo funcionan los diff / patch y qué tan seguros son?

Question

Nov 05, 2015, 02:20 PM

¿Cómo funcionan los diff / patch y qué tan seguros son?

En cuanto a cómo funcionan, me preguntaba cosas de trabajo de bajo nivel:

¿Qué desencadenará un conflicto de fusión?¿Las herramientas también usan el contexto para aplicar el parche?¿Cómo manejan los cambios que en realidad no modifican el comportamiento del código fuente? Por ejemplo, intercambiando lugares de definición de funciones.

En cuanto a la seguridad, la verdad sea dicha, el enorme repositorio del kernel de Linux es un testimonio de su seguridad. Pero me pregunto sobre los siguientes puntos:

¿Existen algunas advertencias / limitaciones con respecto a las herramientas que el usuario debe tener en cuenta?¿Se ha demostrado que los algoritmos no generan resultados incorrectos?Si no, ¿hay implementaciones / documentos que proponen pruebas de integración que al menos demuestren que están libres de errores empíricamente? Algo como el contenido de estos documentosBrianKorver yJamesCoplien.Nuevamente, el repositorio de Linux debería ser suficiente con respecto al punto anterior, pero me preguntaba acerca de algo más genérico. El código fuente, incluso cuando se cambia, no cambiará mucho (especialmente debido al algoritmo implementado y las restricciones de sintaxis), pero ¿se puede generalizar la seguridad a los archivos de texto genéricos?Editar

Ok gente, estoy editando ya que la pregunta es vaga y las respuestas no abordan detalles.

Detalles de Git / diff / patch

El formato de diferencias unificado, que Git parece usar de forma predeterminada, básicamente genera tres cosas: el cambio, el contexto que rodea el cambio y los números de línea pertinentes al contexto. Cada una de estas cosas puede o no haber cambiado simultáneamente, por lo que Git básicamente tiene que lidiar con 8 casos posibles.

Por ejemplo, si se han agregado o eliminado líneas antes del contexto, los números de línea serán diferentes; pero si el contexto y los cambios siguen siendo los mismos, diff podría usar el contexto para alinear los textos y aplicar el parche (no sé si esto realmente sucede). Ahora, ¿qué pasaría en los otros casos? Me gustaría conocer detalles sobre cómo Git decide aplicar los cambios automáticamente y cuándo decide emitir un error y dejar que el usuario resuelva el conflicto.

Fiabilidad

Estoy bastante seguro de que Git es totalmente confiable, ya que tiene el historial completo de confirmaciones y puede atravesar el historial. Lo que me gustaría son algunos consejos para la investigación académica y referencias sobre esto, si existen.

Todavía un poco relacionado con este tema, sabemos que Git / diff trata los archivos como archivos de texto genéricos y funcionan en líneas. Además, el algoritmo LCS empleado por diff generará un parche que intenta minimizar el número de cambios.

Aquí hay algunas cosas que me gustaría saber también:

¿Por qué se usa LCS en lugar de otros algoritmos métricos de cadena?Si se usa LCS, ¿por qué no usar versiones modificadas de la métrica que tengan en cuenta los aspectos gramaticales del lenguaje subyacente?Si se utiliza una métrica que tenga en cuenta los aspectos gramaticales, ¿podrían proporcionar beneficios? Los beneficios en este caso podrían ser cualquier cosa, por ejemplo, un "registro de culpa" más limpio.

Una vez más, estos podrían ser grandes temas y los artículos académicos son bienvenidos.