Como converter uma imagem em segmentos de caracteres?
Muitas vezes, no processo de OCR, um arquivo de imagem é essencialmente cortado em segmentos e cada caractere é reconhecido como um segmento cada. Por exemplo,
tem que ser transformado em algo como
Além disso, existe algum algoritmo para idiomas asiáticos como o Telugu prontamente disponível para esse propósito? Se não, como isso é feito para o inglês?