Wyodrębnianie linii z obrazu w celu przesłania do OCR - Tesseract

Oglądałem ten wykład z pyconhttp://youtu.be/B1d9dpqBDVA?t=15m34s około 15:33 głośnik mówi o wyodrębnianiu linii z obrazu (paragonu), a następnie podawaniu go do silnika OCR, aby tekst można było wyodrębnić w lepszy sposób.

Mam podobną potrzebę, gdy przekazuję obrazy do silnika OCR. Jednak nie do końca rozumiem, co on rozumie, wydobywając linie z obrazu. Jakie narzędzia Open Source mogę wykorzystać do wyodrębnienia linii z obrazu?

questionAnswers(3)

yourAnswerToTheQuestion