herramienta de detección de duplicación de código genérico

Estoy buscando una herramienta de duplicación de código que sea independiente del lenguaje. Es fácil encontrar herramientas de duplicación de código específicas del idioma (para Java, C, PHP, ...), pero me gustaría ejecutar un análisis de duplicación de código en una plantilla con una sintaxis personalizada.

No me importa el análisis avanzado de la sintaxis, solo la comparación de cadenas en bruto basadas en línea recta está bien. El emparejamiento insensible al espacio en blanco sería una ventaja, pero no es obligatorio. (No es tan difícil normalizar / eliminar los espacios en blanco a mí mismo).

¿Alguien sabe una herramienta que puede ser (mal) utilizada para algo como esto?

Gracias.

Respuestas a la pregunta(2)

Su respuesta a la pregunta