Получение ограничивающего прямоугольника распознанных слов с помощью python-tesseract

Question

Dec 30, 2013, 12:15 AM

ocr python-tesseract image-processing tesseract python

Получение ограничивающего прямоугольника распознанных слов с помощью python-tesseract

Я использую python-tesseract для извлечения слов из изображения. Это оболочка Python для tesseract, которая представляет собой код OCR.

Я использую следующий код для получения слов:

import tesseract

api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_DEFAULT)
api.SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyz")
api.SetPageSegMode(tesseract.PSM_AUTO)

mImgFile = "test.jpg"
mBuffer=open(mImgFile,"rb").read()
result = tesseract.ProcessPagesBuffer(mBuffer,len(mBuffer),api)
print "result(ProcessPagesBuffer)=",result

Это возвращает только слова, а не их расположение / размер / ориентацию (или, другими словами, ограничивающий прямоугольник, содержащий их) на изображении. Мне было интересно, есть ли способ получить это также

Получение ограничивающего прямоугольника распознанных слов с помощью python-tesseract

Ответы на вопрос(5)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Получение ограничивающего прямоугольника распознанных слов с помощью python-tesseract

Ответы на вопрос(5)

Ваш ответ на вопрос

Популярные вопросы