processamento de imagem de documento

Estou trabalhando em um aplicativo para processar imagens de documentos (principalmente faturas) e, basicamente, gostaria de converter determinadas regiões de interesse em uma estrutura XML e depois classificar o documento com base nesses dados. Atualmente, estou usando o ImageJ para analisar a imagem do documento e o Asprise / tesseract para OCR.

Agora estou procurando algo para facilitar o desenvolvimento. Especificamente, estou procurando algo para alinhar automaticamente uma imagem do documento e analisar a estrutura do documento (por exemplo, converter uma imagem em uma estrutura quadtree para facilitar o processamento). Embora prefira Java e ImageJ, estou interessado em quaisquer bibliotecas / códigos / documentos, independentemente da linguagem de programação em que está escrito.

Enquanto o sistema em que estou trabalhando deve, na medida do possível, processar dados automaticamente, o usuário deve supervisionar os resultados e, se necessário, corrigir a classificação sugerida pelo sistema. Portanto, estou interessado em usar técnicas de aprendizado de máquina para obter resultados mais confiáveis. Quando documentos semelhantes são processados, p. faturas de uma empresa específica, sua estrutura geralmente é a mesma. Quando o usuário já corrigiu dados de documentos de uma empresa, essas correções devem ser consideradas no futuro. Eu tenho apenas um conhecimento limitado das técnicas de aprendizado de máquina e gostaria de saber como eu poderia realizar minha ideia.

questionAnswers(3)

yourAnswerToTheQuestion