Resultados de la búsqueda a petición "ocr"

1 la respuesta

Extracto de Apache Tika archivos PDF escaneados

Tengo algunos problemas al usar Apache TIKA (versión 1.10). Tengo algunos archivos PDF que son solo hojas de papel escaneadas. Eso significa que cada página es solo una imagen. Mi objetivo es extraer el texto de los archivos PDF de todos ...

2 la respuesta

Software para mejorar los resultados de OCR basados en la salida de múltiples paquetes de software de OCR

¿Existe alguna pieza de software comercial o académico ya existente que pueda resultados de superposición de múltiples paquetes de OCR (Abbyy FineReader, Adobe Acrobat Professional, ReadIris, etc.)Proporcionar mejoras totalmente automatizadas ...

1 la respuesta

Tesseract cree que mis 1 son 7

Parece que este es probablemente un problema común con OCR. ¿Hay alguna forma de decirle a tesseract que mis 1 son en realidad 1? Espero que sin cambiar mis 7's en 1's en el proceso. Nota: estos son documentos escaneados y no tengo idea de qué ...

2 la respuesta

¿Cómo encuentro todos los archivos PDF basados en imágenes?

Tengo muchos documentos PDF en mi sistema, y a veces noto que los documentos están basados en imágenes sin capacidad de edición. En este caso, hago OCR para una mejor búsqueda en Foxit PhantomPDF donde puedes hacer OCR en varios archivos. Me ...

2 la respuesta

Dividir líneas de texto en el documento escaneado

Estoy tratando de encontrar una manera de romper la división de las líneas de texto en un documento escaneado que ha sido adaptado por umbral. En este momento, estoy almacenando los valores de píxeles del documento como entradas sin signo de 0 a ...

9 la respuesta

OCR lib para fórmulas matemáticas

Necesito una biblioteca OCR abierta que pueda escanear fórmulas matemáticas impresas complejas (por ejemplo, algunas fórmulas que se generaron a través de LaTeX). Quiero obtener una salida similar a LaTeX (o solo algunos datos similares a ...

1 la respuesta

El motor OCR de Windows no reconoce el texto en el lienzo (convertido a mapa de bits)

Tengo un proyecto de Córdoba donde tengo un "bloc de notas" donde el usuario puede garabatear sus notas. Este es un simple objeto de lienzo, y me gustaría obtener elMotor ...

7 la respuesta

No se pudo inicializar la API de Tesseract con language = eng

Estoy trabajando en una aplicación de Android que requiere OCR. He decidido usar Tesseract [https://github.com/rmtheis/tess-two] como API pero sigo recibiendo este error: E / Tesseract (nativo): no se pudo inicializar la API de Tesseract con ...

2 la respuesta

Recomendaciones de la biblioteca @Java OCR? [duplicar

Esta pregunta ya tiene una respuesta aquí: mplementación de @Java OCR [cerrado] [/questions/1813881/java-ocr-implementation] 5 respuestas Necesito verificar una tonelada de imágenes para ver si tienen una palabra clave. ¿Alguien puede recomendar ...

3 la respuesta

Extracción de texto de una imagen usando java

¿Es posible que lea el texto de una imagen sin utilizar ninguna API de terceros?