Den Begrenzungsrahmen der erkannten Wörter mit Python-Tesseract ermitteln
Ich benutze Python-Tesseract, um Wörter aus einem Bild zu extrahieren. Dies ist ein Python-Wrapper für tesseract, bei dem es sich um einen OCR-Code handelt.
Ich verwende den folgenden Code, um die Wörter zu erhalten:
import tesseract
api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_DEFAULT)
api.SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyz")
api.SetPageSegMode(tesseract.PSM_AUTO)
mImgFile = "test.jpg"
mBuffer=open(mImgFile,"rb").read()
result = tesseract.ProcessPagesBuffer(mBuffer,len(mBuffer),api)
print "result(ProcessPagesBuffer)=",result
Dies gibt nur die Wörter und nicht deren Position / Größe / Ausrichtung (oder mit anderen Worten einen Begrenzungsrahmen, der sie enthält) im Bild zurück. Ich habe mich gefragt, ob es einen Weg gibt, das auch zu bekommen