Получение ограничивающего прямоугольника распознанных слов с помощью python-tesseract
Я использую python-tesseract для извлечения слов из изображения. Это оболочка Python для tesseract, которая представляет собой код OCR.
Я использую следующий код для получения слов:
import tesseract
api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_DEFAULT)
api.SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyz")
api.SetPageSegMode(tesseract.PSM_AUTO)
mImgFile = "test.jpg"
mBuffer=open(mImgFile,"rb").read()
result = tesseract.ProcessPagesBuffer(mBuffer,len(mBuffer),api)
print "result(ProcessPagesBuffer)=",result
Это возвращает только слова, а не их расположение / размер / ориентацию (или, другими словами, ограничивающий прямоугольник, содержащий их) на изображении. Мне было интересно, есть ли способ получить это также