ferramenta de detecção de duplicação de código genérico

Eu estou procurando uma ferramenta de duplicação de código que é agnóstico de idioma. É fácil encontrar ferramentas de duplicação de código específicas de linguagem (para Java, C, PHP, ...), mas gostaria de executar algumas análises de duplicação de código em modelos em uma sintaxe personalizada.

Eu não me importo com análise avançada da sintaxe, apenas a comparação de seqüência de caracteres simples baseada em linha reta está bem. A correspondência insensível ao espaço em branco seria uma vantagem, mas não obrigatória. (Não é tão difícil de normalizar / eliminar o espaço em branco.)

Alguém conhece uma ferramenta que pode ser (mal) usada para algo assim?

Obrigado.

questionAnswers(2)

yourAnswerToTheQuestion