Wykrywaj i zmieniaj ciągi w plikach PDF
Chcę być w stanie wykryć wzór w pliku PDF i jakoś go oznaczyć.
Na przykład wten plik PDF, jest sznur*2
. Chcę móc analizować plik PDF, wykryć wszystkie wystąpienia*[integer]
i zrób coś, aby zwrócić uwagę na mecze (np. zaznacz je na żółto lub dodaj symbol na marginesie).
Wolałbym to zrobić w Pythonie, ale jestem otwarty na inne języki. Do tej pory byłem w stanie użyćpyPdf przeczytać tekst PDF. Mogę użyć wyrażenia regularnego do wykrycia wzorca. Ale nie udało mi się znaleźć sposobu oznaczenia meczu i ponownego zapisania pliku PDF.