Exportieren Sie die HOCR-Ausgabe für Tesseract OCR in Android

Ich habe versucht zu verwendenTess-Two, eine Gabelung von Tesseract Tools für Android. Ich möchte einschaltenhocr Ausgabe in Tesseract, von diesemVerknüpfungIch habe versucht, die Variable zu setzentessedit_create_hocr wie wahr, aber ich kann hocr in der Ausgabe nicht sehen. Hier ist mein Versuch:

  baseApi.init(FileUtil.getAppFolder(), "eng", TessBaseAPI.OEM_TESSERACT_CUBE_COMBINED);
  baseApi.setVariable("tessedit_create_hocr", "1")
  baseApi.setImage(bitmap);
  String recognizedText = baseApi.getUTF8Text();

Jemand hat das erzählthocr Die Ausgabe sollte im Konfigurationsordner oder im Ordner Bild enthalten sein, aber ich sehe nichts. Ich weiß nicht, wie ich den Dateinamen und den Speicherort der hocr-Ausgabe konfigurieren soll.

Eine andere Sache: Gibt es eine Möglichkeit, die Konfigurationsdatei in Tesseract Tools für Android anzuwenden? Ich habe die Konfigurationsdateien intessdata / config ordner, aber da ist nichts passiert. Wie zu sagentesseract sollten diese Konfigurationsdateien lesen? Anscheinend haben sie nicht genug Dokumente für Android.

Aktualisieren: Dank an@nguyenqJetzt kann ich bekommenHOCR Daten. Hier ist mein Versuch:

  jstring Java_com_googlecode_tesseract_android_TessBaseAPI_nativeGetHOCRText(JNIEnv *env,
                                                                        jobject thiz,    jint page) {

 native_data_t *nat = get_native_data(env, thiz);

 char *text = nat->api.GetHOCRText(page);

 jstring result = env->NewStringUTF(text);

 free(text);

 return result;
 }

Antworten auf die Frage(1)

Ihre Antwort auf die Frage