Erkennen und Ändern von Zeichenfolgen in PDFs

Ich möchte in der Lage sein, ein Muster in einem PDF zu erkennen und es irgendwie zu kennzeichnen.

Zum Beispiel indieses PDFDa ist die Schnur*2. Ich möchte in der Lage sein, das PDF zu analysieren und alle Instanzen von zu erkennen*[integer], und machen Sie auf die Übereinstimmungen aufmerksam (z. B. markieren Sie sie gelb oder fügen Sie ein Symbol am Rand hinzu).

Ich würde es vorziehen, dies in Python zu tun, aber ich bin offen für andere Sprachen. Bisher konnte ich verwendenpyPdf um den PDF-Text zu lesen. Ich kann einen regulären Ausdruck verwenden, um das Muster zu erkennen. Aber ich konnte nicht herausfinden, wie ich die Übereinstimmung kennzeichnen und die PDF-Datei erneut speichern kann.

Antworten auf die Frage(2)

Ihre Antwort auf die Frage