Rozpoznawanie znaków za pomocą tesseract
Staram się wchodzić w interakcjetesseract
API również jestem nowy w przetwarzaniu obrazów i walczę z nim przez ostatnie kilka dni. Próbowałem prostych algorytmów i osiągnąłem około 70% dokładności.
Chcę, aby jego dokładność wynosiła 90 +%. Problem z obrazami polega na tym, że są w rozdzielczości 72 dpi. Próbowałem też zwiększyć rozdzielczość, ale nie osiągałem dobrych wyników, obrazy, które próbuję rozpoznać, są dołączone.
Każda pomoc byłaby doceniana i przykro mi, jeśli zapytałem o coś bardzo podstawowego.
EDYTOWAĆ
Zapomniałem wspomnieć, że próbuję wykonać wszystkie operacje przetwarzania i rozpoznawania w ciągu 2-2,5 sekundyLinux
platforma i metoda wykrywania tekstu wymienionego w tej odpowiedzi zajmuje dużo czasu. Wolę też nie używać rozwiązania wiersza poleceń, ale wolęLeptonica
lubOpenCV
.
Większość zdjęć jest przesyłanatutaj
Próbowałem podążać za różnymi rzeczami, aby binaryzować bilety, ale nie miałem szczęścia
http://www.vincent-net.com/luc/papers/10wiley_morpho_DIAapps.pdfhttp://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.193.6347&rep=rep1&type=pdfhttp://iit.demokritos.gr/~bgat/PatRec2006.pdfhttp://psych.stanford.edu/~jlm/pdfs/Sternberg67.pdfBilet zawiera
trochę kiepskie światłoObszar nietekstowymniejsza rozdzielczośćPróbowałem przekazać obraz bezpośrednio do API tesseract i daje mi 70% dobrych wyników w średniej 1 sek. Ale chcę zwiększyć dokładność w dostrzeganiu czynnika czasu. Dotychczas próbowałem
Wykryj krawędzie obrazuAnaliza kropelkowa dla plamBinaryzował bilet za pomocą adaptacyjnego progowaniaNastępnie próbowałem dostarczyć te binaryzowane obrazy do tesseract, a dokładność zmniejszono do mniej niż 50-60%, chociaż binaryzowany obraz wygląda idealnie.