Text bloqueia a detecção de posições e tamanhos no modo de linha de comando no tesseract

Question

Jan 22, 2012, 04:27 PM

command-line-arguments textblock ocr tesseract

Text bloqueia a detecção de posições e tamanhos no modo de linha de comando no tesseract

tesseract OCR possui uma interface de linha de comando, que nos permite reconhecer texto de imagens com alguns parâmetro

Argumentos de entrada são imagename (caminho da imagem) outputbase (nome do texto reconhecido) e -psm pagesegmode parâmetros.

pagesegmode values are:
 0 = Orientation and script detection (OSD) only.
 1 = Automatic page segmentation with OSD.
 2 = Automatic page segmentation, but no OSD, or OCR
 3 = Fully automatic page segmentation, but no OSD. (Default)
 4 = Assume a single column of text of variable sizes.
 5 = Assume a single uniform block of vertically aligned text.
 6 = Assume a single uniform block of text.
 7 = Treat the image as a single text line.
 8 = Treat the image as a single word.
 9 = Treat the image as a single word in a circle.
 10 = Treat the image as a single character.
-l lang and/or -psm pagesegmode must occur before anyconfigfile.

Mas a biblioteca pode gravar posições e tamanhos de blocos de texto reconhecidos no arquivo específico ou é uma informação intern