Den Begrenzungsrahmen der erkannten Wörter mit Python-Tesseract ermitteln

Ich benutze Python-Tesseract, um Wörter aus einem Bild zu extrahieren. Dies ist ein Python-Wrapper für tesseract, bei dem es sich um einen OCR-Code handelt.

Ich verwende den folgenden Code, um die Wörter zu erhalten:

import tesseract

api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_DEFAULT)
api.SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyz")
api.SetPageSegMode(tesseract.PSM_AUTO)

mImgFile = "test.jpg"
mBuffer=open(mImgFile,"rb").read()
result = tesseract.ProcessPagesBuffer(mBuffer,len(mBuffer),api)
print "result(ProcessPagesBuffer)=",result

Dies gibt nur die Wörter und nicht deren Position / Größe / Ausrichtung (oder mit anderen Worten einen Begrenzungsrahmen, der sie enthält) im Bild zurück. Ich habe mich gefragt, ob es einen Weg gibt, das auch zu bekommen

Antworten auf die Frage(5)

Ihre Antwort auf die Frage