Выделите текст в PDF с помощью Python [закрыто]

Я работаю над системой пользовательского поиска для моего корпуса данных PDF.

У меня есть слой преобразования, который может выводить содержимое PDF в текст (используя Apache Tika и GROBID). Я закончил поиск слоев и вид, который возвращает результаты поиска.

Теперь я хотел бы добавить функцию выделения в исходном PDF-файле для строк, где появлялись поисковые запросы. Да, я хочу изменить PDF-файлы, если это необходимо.

Есть ли способ выделить текст внутри файла PDF? PDFMiner или PyPDF2 или другая библиотека Python в состоянии сделать это?

... или вы можете порекомендовать другой, может быть, внешний сервис для него?

Ответы на вопрос(1)

Ваш ответ на вопрос