Tess-two OCR не работает
я пытаюсь получить текст с изображения, используя tess-two на Android.
Но это дает мне действительно плохой результат
01-16 12:00:25.339: I/Tesseract(native)(29038): Initialized Tesseract API with language=spa
и, как через 30 секунд, он показывает это в виде строки результата:
{ga
.,
r¿
y“: A
r M í
:3
' ‘Ev’.-:.. -: A 7
» w- ?" _
Á.» ¿"A ¿rw-V r
mjÏfn 'n’n . Y
' "\'ZA".‘.¡ A‘ :‘ïvAv- « ‘
:"Éf‘Ï'" -Ï«l :‘,.v:...»- .
' RFI' .. ’ g)" 3;:- 1-;4',
= * ¿,arifgggk mw; .1. ,
' "53» "J
't‘ ‘ ¿Las ;.‘».L',-‘»
' ' 'N‘“ "“=: - '. V . ‘9!
5.? ' “F a .“
Y , <_ 7- . 7.-, .
;« z "1:;2wr . A - . ' -»‘ 5“:
“4-”, ¿rn 73:33: w v'.‘ ¿a ‘ A ,z, v VA
...,,« ' 'Q ' ‘, 4 214€. 5 . AV ¿JL y .13:
1 » . 21mm; » ¿ati-“fl ¿ab-1377*“ w”
. x ‘ ‘ ú F v'v:
1 . ' . ; (“ya í .
конечно, это не правильно, я использую это фото:
Я пробовал это много раз, всегда схожий результат.
Что может быть не так, это мой код, использующий tess-two
TessBaseAPI baseApi = new TessBaseAPI();
baseApi.init("/mnt/sdcard/external_sd/tess/", "spa",TessBaseAPI.OEM_TESSERACT_ONLY);
baseApi.setImage(bitmap);
String recognizedText = baseApi.getUTF8Text();
Log.d("Texto leido", "texto: "+recognizedText);
baseApi.end();
и вот как я получаю растровое изображение из файла
BitmapFactory.Options options = new BitmapFactory.Options();
options.inPreferredConfig = Bitmap.Config.ARGB_8888;
Bitmap bitmap = BitmapFactory.decodeFile(photopath.getAbsolutePath(), options);
Я использую это растровое изображение на изображении, и это кажется правильным, поэтому я не могу найти, почему он работает так плохо.
Любая идея?