Результаты поиска по запросу "pypdf"
Извлечение текста с использованием столбцов PdfMiner и PyPDF2 Merges
Я пытаюсь проанализировать текст PDF-файла с помощью pdfMiner, но извлеченный текст объединяется. Я использую PDF-файл по следующей ссылке. PDF файл [http://www.housingnyc.com/downloads/resources/sta_bldngs/2011StatenIslBldgs.pdf] Я хорош с ...
Извлечение текста с использованием столбцов PdfMiner и PyPDF2 Merges
Я пытаюсь проанализировать текст PDF-файла с помощью pdfMiner, но извлеченный текст объединяется. Я использую PDF-файл по следующей ссылке.PDF файлЯ хорош с ...
PyPDF2 не будет импортировать
Привет, я только начинаю работать с python и пытаюсь установить необходимые библиотеки. Используя Python 3.4.1 на OS X. Я установил PyPDF2 (с предполагаемым ...
pypdf Объединение нескольких файлов PDF в один PDF
Если у меня есть 1000+ PDF-файлы должны быть объединены в один PDF, input = PdfFileReader() output = PdfFileWriter() filename0000 ----- filename 1000 input = PdfFileReader(file(filename, "rb")) pageCount = input.getNumPages() for iPage in ...
pyPdf игнорирует переводы строк в файле PDF
Я пытаюсь извлечь каждую страницу PDF в виде строки:
Обнаружение и изменение строк в PDF-файлах
Я хочу быть в состоянии обнаружить шаблон в PDF и как-то пометить его. Например, вэтот PDF [https://docs.google.com/file/d/0B_DIkLaQ8uTIcWVJbjRLa3VGalU/edit?usp=sharingt] есть строка*2, Я хочу иметь возможность анализировать PDF, обнаруживать ...
Пробелы ушли от извлечения PDF, и странная интерпретация слова
Используя приведенный ниже фрагмент, я попытался извлечь текстовые данные изэтот PDF файл
Обнаружение и изменение строк в PDF-файлах
Я хочу быть в состоянии обнаружить шаблон в PDF и как-то пометить его.Например, вэтот PDF, там'Строка
Да, я уже пытался это сделать. Тем не менее, это не работает! Две страницы все еще на 90 градусов разные. Я начинаю думать, что в pyPdf есть либо ошибка, либо в моем pdf-файле page1 происходит что-то интересное.
я проблемы с объединением двух файлов PDF с pyPdf. Когда я запускаю следующий код, водяной знак (страница 1) выглядит нормально, но страница 2 была повернута на 90 градусов по часовой стрелке. Есть идеи, что происходит? from pyPdf import ...
Открытие PDF-URL с помощью PyPdf
Как бы я открыть PDF с URL-адреса, а не с диска Что-то вроде input1 = PdfFileReader(file("http://example.com/a.pdf", "rb"))Я хочу открыть несколько файлов из Интернета и загрузить объединение всех файлов.