Tesseract OCR: Reconoce solo palabras completas del diccionario

Estoy usando el complemento de OCR tesseract para phonegap:https://github.com/jcesarmobile/PhonegapOCRPlugin/i

Estoy tratando de configurar tesseract para que reconozca solo palabras completas del diccionario. Es decir: sin caracteres especiales, ni sufijos ni prefijos, etc.

Como la carpeta tessdata de este proyecto no contiene ninguna configuración, pensé que debería establecer configuraciones en init. En este momento estoy tratando de establecer configuraciones modificando claseAuxiliar.mm pero no puedo decir que haya notado ninguna diferencia, esto podría deberse a que las configuraciones son incorrectas o que las estoy configurando mal. A continuación están mis configuraciones y cómo intento configurarlas actualmente:

    // init the tesseract engine.
    tesseract = new tesseract::TessBaseAPI();
    tesseract->Init([dataPath cStringUsingEncoding:NSUTF8StringEncoding], "eng");
    if (!tesseract->SetVariable("segment_penalty_dict_nonword","10"))
    printf("Setting variable failed!!!\n");
    if (!tesseract->SetVariable("segment_penalty_garbage","10"))
    printf("Setting variable failed!!!\n");
    if (!tesseract->SetVariable("stopper_nondict_certainty_base","-100"))
    printf("Setting variable failed!!!\n");
    if (!tesseract->SetVariable("language_model_penalty_non_dict_word","1"))
    printf("Setting variable failed!!!\n");
    if (!tesseract->SetVariable("language_model_penalty_non_freq_dict_word","1"))
    printf("Setting variable failed!!!\n");
    if (!tesseract->SetVariable("GARBAGE_STRING","5"))
    printf("Setting variable failed!!!\n");
    if (!tesseract->SetVariable("NON_WERD","5"))
    printf("Setting variable failed!!!\n");

Respuestas a la pregunta(1)

Su respuesta a la pregunta