Resultados de la búsqueda a petición "pdf-scraping"

2 la respuesta

Reconocer tabla PDF usando R

Estoy tratando de extraer datos de tablas dentro de algunos informes en pdf. He visto algunos ejemplos usando pdftools y paquetes similares. Tuve éxito en obtener el texto, sin embargo, solo quiero extraer las tablas. ¿Hay alguna manera de usar ...

13 la respuesta

Módulo de Python para convertir PDF a texto [cerrado]

¿Cuáles son los mejores módulos de Python para convertir archivos PDF en texto?

1 la respuesta

Programáticamente reemplazar texto en PDF

Tengo archivos PDF con texto que deben reemplazarse. Más específicamente, el texto debe traducirse y reemplazarse por la versión traducida. Es importante que el resto de la estructura PDF permanezca intacta. Tenga en cuenta que el texto está ...

10 la respuesta

Lectura de datos de archivos PDF en R

¡¿Eso es posible ?! Tengo un montón de informes heredados que necesito importar a una base de datos. Sin embargo, todos están en formato pdf. ¿Hay algunaR paquetes que pueden leer pdf? ¿O debería dejar eso a una herramienta de línea de ...

3 la respuesta

Extraer / identificar tablas de PDF python [cerrado]

¿Hay alguna biblioteca de código abierto que admita la identificación y extracción de tablas? Con esto quiero decir: Identificar que existe una estructura de tablaClasifica la tabla de su contenidoExtraiga datos de la tabla en un formato de ...

1 la respuesta

iTextSharp PDF Lectura de texto resaltado (anotaciones resaltadas) usando C #

Estoy desarrollando una aplicación C # winform que convierte el contenido del pdf a texto. Se extraen todos los contenidos requeridos, excepto el contenido que se encuentra en el texto resaltado del pdf. Ayude a obtener la muestra de trabajo para ...

1 la respuesta

tm readPDF: Error en el archivo (con, “r”): no se puede abrir la conexión