Предварительная обработка изображений перед процессом распознавания

Мой текущий проект включает в себя транскрибирование текстов в формате pdf в текстовые файлы, и я сначала попытался поместить файл изображения непосредственно в программу OCR (tesseract), и это не сработало. Исходные файлы изображений, в основном, являются старыми газетами и имеют некоторые фоновые шумы, с которыми, я уверен, у tesseract есть проблемы. Поэтому я пытаюсь использовать некоторую предварительную обработку изображения перед подачей его в тессеракт. Есть ли какие-либо предложения для движка предварительной обработки изображений с открытым исходным кодом, который хорошо подходит для этой ситуации ??? И инструкции по его применению будут еще более ценными!

Ответы на вопрос(3)

Ваш ответ на вопрос