Resultados de la búsqueda a petición "pdfminer"

0 la respuesta

PDFMiner no puede extraer la fuente

Estoy convirtiendo algunos informes en PDF a texto sin formato con PDFMiner y un montón de mis PDF de entrada solo salen con un par de líneas reconocidas y luego una lista de (cid:% d) un poco como esto ... Reporte de inspección (cid: 4) (cid: ...

1 la respuesta

Python PDFMIner - PDF a CSV

Quiero poder convertir archivos PDF a archivos CSV y he encontrado varios scripts útiles, pero, como soy nuevo en Python, tengo una pregunta: ¿Dónde especifica la ruta del archivo PDF y el CSV en el que desea imprimir? Estoy usando Python ...

1 la respuesta

Resalte el texto en un PDF con Python [cerrado]

Estoy trabajando en un motor de búsqueda personalizado para mi corpus de datos PDF. Tengo una capa de transformación que puede volcar contenido PDF en texto (usando Apache Tika y GROBID). He terminado las capas de búsqueda y la vista ...

1 la respuesta

¿Qué hacer con los CID en el texto extraído por PDFMiner?

Tengo algunos archivos PDF que están en hindi y tienen texto extraíble. Solía pdfminer.six [https://github.com/pdfminer/pdfminer.six] para python 3.6, para hacer la extracción. El resultado se ve así: [/imgs/cZGKz.png] omo se puede ver, hay ...

2 la respuesta

pdfminer3k no tiene un método llamado create_pages en PDFPage

Como quiero pasar de python 2 a 3, intenté trabajar con pdfmine.3kr en python 3.4. Parece que lo han editado todo. Sus registros de cambios no reflejan los cambios que han realizado, pero no tuve éxito al analizar pdf con pdfminer3k. Por ...

2 la respuesta

pdfminer - ImportError: ningún módulo llamado pdfminer.pdfdocument

Estoy tratando de instalar pdfMiner para trabajar con CollectiveAccess. Mi anfitrión (pair.com) me ha brindado la siguiente información para ayudar en esta búsqueda: Al compilar, es probable que sea necesario instruir al instalación para usar el ...

2 la respuesta

¿Extraer texto de un archivo PDF usando PDFMiner en Python?

Python versión 2.7 Estoy buscando documentaciono ejemplos sobre cómo extraer texto de un archivo PDF usando PDFMiner con Python. Parece que PDFMiner actualizó su API y todos los ejemplos relevantes que he encontrado contienen código ...

14 la respuesta

¿Cómo uso pdfminer como biblioteca

Estoy tratando de obtener datos de texto de un pdf usando pdfminer [http://www.unixuser.org/~euske/python/pdfminer/index.html]. Puedo extraer estos datos a un archivo .txt con éxito con la herramienta de línea de comandos pdfminer pdf2txt.py. ...

2 la respuesta

Extraer tablas de un pdf

Estoy tratando de obtener los datos de las tablas en estePDF [https://www.dropbox.com/s/y3nivxhjvvzva7d/test1.pdf?dl=0]. He probado pdfminer y pypdf con un poco de suerte, pero realmente no puedo obtener los datos de las tablas. Así es como se ...