Результаты поиска по запросу "pdfminer"
Выделите текст в PDF с помощью Python [закрыто]
Я работаю над системой пользовательского поиска для моего корпуса данных PDF.У меня есть слой преобразования, который может выводить содержимое PDF в текст (...
У pdfminer3k нет метода с именем create_pages в PDFPage
Поскольку я хочу перейти с python 2 на 3, я попытался работать с pdfmine.3kr в python 3.4. Кажется, что они отредактировали все. Их журналы изменений не отра...
pdfminer - ImportError: нет модуля с именем pdfminer.pdfdocument
Я пытаюсь установить pdfMiner для работы с CollectiveAccess. Мой хозяин (pair.com) дал мне следующую информацию, чтобы помочь в этом квесте:При компиляции, в...
Извлечение таблиц из PDF
Я пытаюсь получить данные из таблиц в этомPDF, Я попытался pdfminer и pypdf с небольшой удачей, но я не могу получить данные из таблиц.Вот как выглядит одна ...
PDFMiner не может извлечь шрифт
Я конвертирую некоторые отчеты в формате PDF в обычный текст, используя PDFMiner, и куча моих входных PDF-файлов просто выходит с несколькими распознанными с...
карты для тех шрифтов, у которых отсутствует такая карта, рисуя каждый глиф шрифта на растровом изображении, отделив его от всего остального и применяя к нему оптическое распознавание символов, вы, как получатель PDF, внезапно используете программу шрифтов для рисования чего-то другого, кроме оригинал документа, и это может рассматриваться как использование, на которое не распространяется лицензия.
я есть несколько PDF-файлов, которые находятся на хинди и имеют извлекаемый текст. я использовалpdfminer.six [https://github.com/pdfminer/pdfminer.six]для Python 3.6, чтобы сделать извлечение. Вывод выглядит так: [/imgs/cZGKz.png] Как видно, ...