Результаты поиска по запросу "pdf-scraping"

1 ответ

tm readPDF: ошибка в файле (con, «r»): не удается открыть соединение

13 ответов

Модуль Python для преобразования PDF в текст [закрыт]

5 ответов

Чтение данных из PDF-файлов в R

Это вообще возможно!?! У меня есть куча устаревших отчетов, которые мне нужно импортировать в базу данных. Тем не менее, они все в формате PDF. Есть лиR пакеты, которые могут читать в формате pdf? Или я должен оставить это инструменту командной ...

ТОП публикаций

1 ответ

 библиотеки для изменения текста или создания PDF-файлов с успехом.

я есть PDF-файлы с текстом, который должен быть заменен. Более конкретно, текст должен быть переведен и заменен переведенной версией. Важно, что остальная часть структуры PDF остается неизменной. Обратите внимание, что текст доступен ...

1 ответ

iTextSharp PDF Чтение выделенного текста (выделение аннотаций) с использованием C #

Я занимаюсь разработкой приложения на C # winform, которое преобразует содержимое PDF в текст. Извлекается все необходимое содержимое, кроме содержимого, най...

2 ответа

 стол.

аюсь извлечь данные из таблиц в некоторых отчетах PDF.Я видел несколько примеров использования pdftools и аналогичных пакетов, мне удалось получить текст, од...

1 ответ

tm readPDF: ошибка в файле (con, «r»): не удается открыть соединение

Я попробовалпример кода, рекомендуемый в документации tm :: readPDF [http://www.inside-r.org/packages/cran/tm/docs/readPDF]: library(tm) if(all(file.exists(Sys.which(c("pdfinfo", "pdftotext"))))) { uri <- system.file(file.path("doc", "tm.pdf"), ...

3 ответа

Извлечь / определить таблицы из PDF Python [закрыто]

Существуют ли библиотеки с открытым исходным кодом, которые поддерживают идентификацию и извлечение таблиц?Под этим я подразумеваю:Определить структуру табли...