Извлечение текста OpenCV

Question

Sep 01, 2017, 03:15 PM

Извлечение текста OpenCV

я есть следующий код (на самом деле это всего лишь 1 часть из 4, необходимая для запуска всего проекта, над которым я работаю ..):

#python classify.py --model models/svm.cpickle --image images/image.png

from __future__ import print_function
from sklearn.externals import joblib
from hog import HOG
import dataset
import argparse
import mahotas
import cv2

ap = argparse.ArgumentParser()
ap.add_argument("-m", "--model", required = True,
    help = "path to where the model will be stored")
ap.add_argument("-i", "--image", required = True,
    help = "path to the image file")
args = vars(ap.parse_args())

model = joblib.load(args["model"])

hog = HOG(orientations = 18, pixelsPerCell = (10, 10),
    cellsPerBlock = (1, 1), transform = True)

image = cv2.imread(args["image"])
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

blurred = cv2.GaussianBlur(gray, (5, 5), 0)
edged = cv2.Canny(blurred, 30, 150)
(_, cnts, _) = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)

cnts = sorted([(c, cv2.boundingRect(c)[0]) for c in cnts], key =
    lambda x: x[1])

for (c, _) in cnts:
    (x, y, w, h) = cv2.boundingRect(c)

    if w >= 7 and h >= 20:
        roi = gray[y:y + h, x:x + w]
        thresh = roi.copy()
        T = mahotas.thresholding.otsu(roi)
        thresh[thresh > T] = 255
        thresh = cv2.bitwise_not(thresh)

        thresh = dataset.deskew(thresh, 20)
        thresh = dataset.center_extent(thresh, (20, 20))

        cv2.imshow("thresh", thresh)

        hist = hog.describe(thresh)
        digit = model.predict([hist])[0]
        print("I think that number is: {}".format(digit))

        cv2.rectangle(image, (x, y), (x + w, y + h),
        (0, 255, 0), 1)
        cv2.putText(image, str(digit), (x - 10, y - 10),
        cv2.FONT_HERSHEY_SIMPLEX, 1.2, (0, 255, 0), 2)
        cv2.imshow("image", image)
        cv2.waitKey(0)

Этот код обнаруживает и распознает рукописные цифры на изображениях. Вот пример:

Допустим, мне плевать на точность распознавания.

Моя проблема в следующем: как видите, программа берет все числа, которые можетвидеть и распечатать их в консоли. С консоли я могу сохранить их в текстовом файле, если я хочу, НО я не могу сказать программе, что между числами есть пробел.

Я хочу, чтобы, если я печатал числа в текстовом файле, они должны быть разделены, как на картинке (извините, но это немного сложно объяснить ..). Числа не должны (даже в консоли) печататься все вместе, но там, где есть пробел, печатать также пустую область.

Посмотрите на изображение ели. После первых 10 цифр в изображении появляется пробел, которого нет в консоли.

В любом случае, вот ссылка на полный код. Есть 4.py файлы и 3 папки. Для выполнения откройте CMD в папке и вставьте командуpython classify.py --model models/svm.cpickle --image images/image.png гдеimage.png Имя одного файла в папке изображений.

Полный код

Заранее спасибо. По моему мнению, вся эта работа должна была бы быть сделана, используя нейронные сети, но я хочу попробовать это сначала таким способом. Я довольно новичок в этом.

Извлечение текста OpenCV

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Извлечение текста OpenCV

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы