Обычно не используйте сжатый формат с потерями, такой как JPG. PNG и TIFF в порядке. Но главная проблема заключается в том, что файл был отсканирован и уловил недостатки бумаги или стекла. Также области текста были слишком близко друг к другу, учитывая разрешение изображения и большое размытие, которое было необходимо.

улучшить качество распознавания, мне нужно предварительно обработать отсканированные изображения. Иногда мне нужно распознать изображение с несколькими изображениями (компоненты на странице расположены под разными углами - например, несколько бумажных документов, отсканированных за один раз), например:

Можно ли автоматически программно разделить такие изображения на отдельные изображения, которые будут содержать каждый логический документ? Например, с помощью такого инструмента, как ImageMagick или что-то еще? Есть ли какие-либо решения / техника существует для такой проблемы?

Ответы на вопрос(2)

Ваш ответ на вопрос