Результаты поиска по запросу "pdfminer"

1 ответ

Выделите текст в PDF с помощью Python [закрыто]

Я работаю над системой пользовательского поиска для моего корпуса данных PDF.У меня есть слой преобразования, который может выводить содержимое PDF в текст (...

2 ответа

У pdfminer3k нет метода с именем create_pages в PDFPage

Поскольку я хочу перейти с python 2 на 3, я попытался работать с pdfmine.3kr в python 3.4. Кажется, что они отредактировали все. Их журналы изменений не отра...

2 ответа

Извлечение текста из файла PDF с использованием PDFMiner в Python?

ТОП публикаций

2 ответа

pdfminer - ImportError: нет модуля с именем pdfminer.pdfdocument

Я пытаюсь установить pdfMiner для работы с CollectiveAccess. Мой хозяин (pair.com) дал мне следующую информацию, чтобы помочь в этом квесте:При компиляции, в...

2 ответа

Извлечение таблиц из PDF

Я пытаюсь получить данные из таблиц в этомPDF, Я попытался pdfminer и pypdf с небольшой удачей, но я не могу получить данные из таблиц.Вот как выглядит одна ...

0 ответов

PDFMiner не может извлечь шрифт

Я конвертирую некоторые отчеты в формате PDF в обычный текст, используя PDFMiner, и куча моих входных PDF-файлов просто выходит с несколькими распознанными с...

1 ответ

 карты для тех шрифтов, у которых отсутствует такая карта, рисуя каждый глиф шрифта на растровом изображении, отделив его от всего остального и применяя к нему оптическое распознавание символов, вы, как получатель PDF, внезапно используете программу шрифтов для рисования чего-то другого, кроме оригинал документа, и это может рассматриваться как использование, на которое не распространяется лицензия.

я есть несколько PDF-файлов, которые находятся на хинди и имеют извлекаемый текст. я использовалpdfminer.six [https://github.com/pdfminer/pdfminer.six]для Python 3.6, чтобы сделать извлечение. Вывод выглядит так: [/imgs/cZGKz.png] Как видно, ...

1 ответ

Python PDFMIner - PDF в CSV