Resultados de la búsqueda a petición "pdf-scraping"
iTextSharp PDF Lectura de texto resaltado (anotaciones resaltadas) usando C #
Estoy desarrollando una aplicación C # winform que convierte el contenido del pdf a texto. Se extraen todos los contenidos requeridos, excepto el contenido que se encuentra en el texto resaltado del pdf. Ayude a obtener la muestra de trabajo para ...
Programáticamente reemplazar texto en PDF
Tengo archivos PDF con texto que deben reemplazarse. Más específicamente, el texto debe traducirse y reemplazarse por la versión traducida. Es importante que el resto de la estructura PDF permanezca intacta. Tenga en cuenta que el texto está ...
Reconocer tabla PDF usando R
Estoy tratando de extraer datos de tablas dentro de algunos informes en pdf. He visto algunos ejemplos usando pdftools y paquetes similares. Tuve éxito en obtener el texto, sin embargo, solo quiero extraer las tablas. ¿Hay alguna manera de usar ...
Extraer / identificar tablas de PDF python [cerrado]
¿Hay alguna biblioteca de código abierto que admita la identificación y extracción de tablas? Con esto quiero decir: Identificar que existe una estructura de tablaClasifica la tabla de su contenidoExtraiga datos de la tabla en un formato de ...
Lectura de datos de archivos PDF en R
¡¿Eso es posible ?! Tengo un montón de informes heredados que necesito importar a una base de datos. Sin embargo, todos están en formato pdf. ¿Hay algunaR paquetes que pueden leer pdf? ¿O debería dejar eso a una herramienta de línea de ...
Módulo de Python para convertir PDF a texto [cerrado]
¿Cuáles son los mejores módulos de Python para convertir archivos PDF en texto?