Detectar y alterar cadenas en archivos PDF.

Quiero poder detectar un patrón en un PDF y marcarlo de alguna manera.

Por ejemplo, eneste PDF, ahí está la cuerda*2. Quiero poder analizar el PDF, detectar todas las instancias de*[integer]y haga algo para llamar la atención sobre las coincidencias (como resaltarlas en amarillo o agregar un símbolo en el margen).

Preferiría hacer esto en Python, pero estoy abierto a otros idiomas. Hasta ahora, he podido utilizarpyPdf Para leer el texto del PDF. Puedo usar una expresión regular para detectar el patrón. Pero no he podido averiguar cómo marcar la coincidencia y volver a guardar el PDF.

Respuestas a la pregunta(2)

Su respuesta a la pregunta