Den Begrenzungsrahmen der erkannten Wörter mit Python-Tesseract ermitteln

Question

Dec 30, 2013, 01:15 AM

ocr python tesseract image-processing python-tesseract

Den Begrenzungsrahmen der erkannten Wörter mit Python-Tesseract ermitteln

Ich benutze Python-Tesseract, um Wörter aus einem Bild zu extrahieren. Dies ist ein Python-Wrapper für tesseract, bei dem es sich um einen OCR-Code handelt.

Ich verwende den folgenden Code, um die Wörter zu erhalten:

import tesseract

api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_DEFAULT)
api.SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyz")
api.SetPageSegMode(tesseract.PSM_AUTO)

mImgFile = "test.jpg"
mBuffer=open(mImgFile,"rb").read()
result = tesseract.ProcessPagesBuffer(mBuffer,len(mBuffer),api)
print "result(ProcessPagesBuffer)=",result

Dies gibt nur die Wörter und nicht deren Position / Größe / Ausrichtung (oder mit anderen Worten einen Begrenzungsrahmen, der sie enthält) im Bild zurück. Ich habe mich gefragt, ob es einen Weg gibt, das auch zu bekommen