Обнаружение и изменение строк в PDF-файлах
Я хочу быть в состоянии обнаружить шаблон в PDF и как-то пометить его.
Например, вэтот PDFесть строка*2
, Я хочу иметь возможность анализировать PDF, обнаруживать все случаи*[integer]
и сделайте что-нибудь, чтобы привлечь внимание к совпадениям (например, выделите их желтым или добавьте символ на полях).
Я бы предпочел сделать это на Python, но я открыт для других языков. До сих пор я был в состоянии использоватьpyPdf читать текст PDF. Я могу использовать регулярное выражение, чтобы обнаружить шаблон. Но я не смог выяснить, как пометить совпадение и заново сохранить PDF.