Resultados de la búsqueda a petición "pdf-parsing"

4 la respuesta

Parcar archivos PDF en Hadoop Map Reduce

Tengo que analizar archivos PDF, que están en HDFS en un programa Map Reduce en Hadoop. Entonces obtengo el archivo PDF de HDFS comoInput splits y debe analizarse y enviarse a la clase Mapper. Para implementar este InputFormat, había pasado por ...

6 la respuesta

Ruby: Lectura de archivos PDF

Estoy buscando una forma rápida y confiable de leer / analizar archivos PDF grandes en Ruby (en Linux y OSX). Hasta ahora he encontrado la @ bastante antigua y simp PDF-toolkit [http://pdf-toolkit.rubyforge.org/] (una ...

3 la respuesta

Extraer tabla de un PDF

1 la respuesta

Diferencia entre las versiones de iTextSharp 4.1.6 y 5.x

Estamos desarrollando un analizador de PDF para ser utilizado junto con nuestro sistema. El requisito es tal que almacenamos toda la información en cualquier documento pdf y deberíamos poder reproducir el documento como tal (con cambios mínimos ...

1 la respuesta

¿Qué es esto (cid: 51) en la salida de pdf2txt?

Así que estoy tratando de extraer el texto de un archivo pdf, necesito su posición, ancho, alto, fuente.He probado muchos, pero la solución más útil y comple...