Обработка изображений для оптического распознавания текста с лептоной (обратный цветной текст)

Question

Jul 28, 2012, 12:20 AM

Обработка изображений для оптического распознавания текста с лептоной (обратный цветной текст)

Я пытаюсь обработать следующее изображение с помощью лептоники, чтобы извлечь текст с помощью тессеракта.

Original Image:

Тессеракт на оригинальном изображении дает это:

i s l
D2J1FiiE-l191x1iitmwii9 uhiaiislz-2 Q ~37
Bottom linez
With a little time!
you can learn social media technology
using free online resources-
And if you donity
youlll be at a significant disadvantage
to
other HOn-pFOiiTS-

Не отлично, особенно на верхнем фоне. Поэтому, используя leptionica, я использую алгоритм удаления фона (размытие, разница, порог, инвертирование), чтобы получить следующее изображение: processed image

Но тессеракт не справляется с этим:

@@r-mair lkrm@W lh@w ilr@ mJs@ iklh@ ii@c2lhm1@ll
mm Mime
VWU1 a Mitt-Jle time-
@1m ll@@Wn Om @@@lh1
using free onhne resources-
Andifyoudoni
9110 ate a $0 D
to other non-profrts
I

Кажется, главная проблема в том, что теперь весь текст выделен, а не сплошной. Как я могу настроить свой алгоритм или что я могу добавить, чтобы текст был сплошным?

Обработка изображений для оптического распознавания текста с лептоной (обратный цветной текст)

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Обработка изображений для оптического распознавания текста с лептоной (обратный цветной текст)

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы