Jak przekonwertować obraz na segmenty znaków?

Często w procesie OCR plik obrazu jest zasadniczo podzielony na segmenty, a każdy znak jest uznawany za segment. Na przykład,

musi zostać przekształcony w coś takiego

Czy istnieje również jakiś algorytm dla języków azjatyckich, takich jak Telugu, który jest łatwo dostępny w tym celu? Jeśli nie, jak to się robi w przypadku języka angielskiego?

questionAnswers(1)

yourAnswerToTheQuestion