Busque una cadena que permita una falta de coincidencia en cualquier ubicación de la cadena

Estoy trabajando con secuencias de ADN de longitud 25 (ver ejemplos a continuación). Tengo una lista de 230,000 y necesito buscar cada secuencia en todo el genoma (parásito toxoplasma gondii). No estoy seguro de qué tan grande es el genoma, pero mucho más de 230,000 secuencias.

Necesito buscar cada una de mis secuencias de 25 caracteres, por ejemplo, (AGCCTCCCATGATTGAACAGATCAT).

El genoma está formateado como una cadena continua, es decir (CATGGGAGGCTTGCGGAGCCTGAGGGCGGAGCCTGAGGTGGGAGGCTTGCGGAGTGCGGAGCCTGAGCCTGAGGGCGGAGCCTGAGGTGGGAGGCTT ....)

No me importa dónde o cuántas veces se encuentre, solo si es o no.
Esto es simple, creo.

str.find(AGCCTCCCATGATTGAACAGATCAT)

Pero también sé qué encontrar una coincidencia cercana definida como incorrecta (no coincidente) en cualquier ubicación, pero solo en una ubicación, y registrar la ubicación en la secuencia. No estoy seguro de cómo hacer esto. Lo único que se me ocurre es usar un comodín y realizar la búsqueda con un comodín en cada posición. Es decir, busca 25 veces.

Por ejemplo,
AGCCTCCCATGATTGAACAGATCAT
AGCCTCCCATGATAGAACAGATCAT

Un partido cercano con un desajuste en la posición 13.

La velocidad no es un gran problema porque solo lo hago 3 veces, aunque sería bueno si fuera rápido.

Hay programas que hacen esto, encontrar coincidencias y coincidencias parciales, pero estoy buscando un tipo de coincidencia parcial que no se pueda descubrir con estas aplicaciones.

Aquí hay una publicación similar para perl, aunque solo comparan secuencias y no buscan una cadena continua:

Publicación relacionada

Respuestas a la pregunta(2)

Su respuesta a la pregunta