Rozpoznawanie znaków za pomocą tesseract

Question

Dec 20, 2013, 01:23 PM

tesseract opencv ocr image-processing c++

Rozpoznawanie znaków za pomocą tesseract

Staram się wchodzić w interakcjetesseract API również jestem nowy w przetwarzaniu obrazów i walczę z nim przez ostatnie kilka dni. Próbowałem prostych algorytmów i osiągnąłem około 70% dokładności.

Chcę, aby jego dokładność wynosiła 90 +%. Problem z obrazami polega na tym, że są w rozdzielczości 72 dpi. Próbowałem też zwiększyć rozdzielczość, ale nie osiągałem dobrych wyników, obrazy, które próbuję rozpoznać, są dołączone.

Każda pomoc byłaby doceniana i przykro mi, jeśli zapytałem o coś bardzo podstawowego.

EDYTOWAĆ

Zapomniałem wspomnieć, że próbuję wykonać wszystkie operacje przetwarzania i rozpoznawania w ciągu 2-2,5 sekundyLinux platforma i metoda wykrywania tekstu wymienionego w tej odpowiedzi zajmuje dużo czasu. Wolę też nie używać rozwiązania wiersza poleceń, ale wolęLeptonica lubOpenCV.

Większość zdjęć jest przesyłanatutaj

Próbowałem podążać za różnymi rzeczami, aby binaryzować bilety, ale nie miałem szczęścia

http://www.vincent-net.com/luc/papers/10wiley_morpho_DIAapps.pdf http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.193.6347&rep=rep1&type=pdf http://iit.demokritos.gr/~bgat/PatRec2006.pdf http://psych.stanford.edu/~jlm/pdfs/Sternberg67.pdf

Bilet zawiera

trochę kiepskie światłoObszar nietekstowymniejsza rozdzielczość

Próbowałem przekazać obraz bezpośrednio do API tesseract i daje mi 70% dobrych wyników w średniej 1 sek. Ale chcę zwiększyć dokładność w dostrzeganiu czynnika czasu. Dotychczas próbowałem

Wykryj krawędzie obrazuAnaliza kropelkowa dla plamBinaryzował bilet za pomocą adaptacyjnego progowania

Następnie próbowałem dostarczyć te binaryzowane obrazy do tesseract, a dokładność zmniejszono do mniej niż 50-60%, chociaż binaryzowany obraz wygląda idealnie.