Nitidez da imagem usando o OpenCV OCR

Question

Jan 14, 2014, 10:56 AM

Nitidez da imagem usando o OpenCV OCR

Estou tentando trabalhar em um script de processamento de imagem / OCR que permita extrair as letras (usandotesseract) nas caixas encontradas na imagem abaixo.

Após muito processamento, consegui obter a imagem com esta aparência

Para remover o ruído, inverti a imagem, seguida de preenchimento e desfoque gaussiano para remover o ruído. Foi assim que acabei em seguida.

Depois de executá-lo por meio de retenção e erosão para remover o ruído (a erosão foi o passo que distorceu o texto), consegui fazer com que a imagem tivesse essa aparência antes de executá-la no tesseract

Isso, embora seja uma renderização muito boa, permite resultados bastante precisos através do tesseract. Embora às vezes falhe porque lê o hash (#) como um H ou W. Isso me leva à minha pergunta!

Há algum caminho usando opencv, skimage, PIL (opencv de preferência) Posso afiar esta imagem para aumentar minhas chances de tesserato ler corretamente minha imagem? OU Existe uma maneira de obter da terceira para a imagem final, sem precisar usar erosão, que distorce o texto da imagem.

Qualquer ajuda seria muito apreciada!