Результаты поиска по запросу "pypdf"

2 ответа

Извлечение текста с использованием столбцов PdfMiner и PyPDF2 Merges

Я пытаюсь проанализировать текст PDF-файла с помощью pdfMiner, но извлеченный текст объединяется. Я использую PDF-файл по следующей ссылке. PDF файл [http://www.housingnyc.com/downloads/resources/sta_bldngs/2011StatenIslBldgs.pdf] Я хорош с ...

2 ответа

Извлечение текста с использованием столбцов PdfMiner и PyPDF2 Merges

Я пытаюсь проанализировать текст PDF-файла с помощью pdfMiner, но извлеченный текст объединяется. Я использую PDF-файл по следующей ссылке.PDF файлЯ хорош с ...

3 ответа

PyPDF2 не будет импортировать

Привет, я только начинаю работать с python и пытаюсь установить необходимые библиотеки. Используя Python 3.4.1 на OS X. Я установил PyPDF2 (с предполагаемым ...

ТОП публикаций

4 ответа

pypdf Объединение нескольких файлов PDF в один PDF

Если у меня есть 1000+ PDF-файлы должны быть объединены в один PDF, input = PdfFileReader() output = PdfFileWriter() filename0000 ----- filename 1000 input = PdfFileReader(file(filename, "rb")) pageCount = input.getNumPages() for iPage in ...

2 ответа

pyPdf игнорирует переводы строк в файле PDF

Я пытаюсь извлечь каждую страницу PDF в виде строки:

2 ответа

Обнаружение и изменение строк в PDF-файлах

Я хочу быть в состоянии обнаружить шаблон в PDF и как-то пометить его. Например, вэтот PDF [https://docs.google.com/file/d/0B_DIkLaQ8uTIcWVJbjRLa3VGalU/edit?usp=sharingt] есть строка*2, Я хочу иметь возможность анализировать PDF, обнаруживать ...

4 ответа

Пробелы ушли от извлечения PDF, и странная интерпретация слова

Используя приведенный ниже фрагмент, я попытался извлечь текстовые данные изэтот PDF файл

2 ответа

Обнаружение и изменение строк в PDF-файлах

Я хочу быть в состоянии обнаружить шаблон в PDF и как-то пометить его.Например, вэтот PDF, там'Строка

5 ответов

Да, я уже пытался это сделать. Тем не менее, это не работает! Две страницы все еще на 90 градусов разные. Я начинаю думать, что в pyPdf есть либо ошибка, либо в моем pdf-файле page1 происходит что-то интересное.

я проблемы с объединением двух файлов PDF с pyPdf. Когда я запускаю следующий код, водяной знак (страница 1) выглядит нормально, но страница 2 была повернута на 90 градусов по часовой стрелке. Есть идеи, что происходит? from pyPdf import ...

2 ответа

Открытие PDF-URL с помощью PyPdf

Как бы я открыть PDF с URL-адреса, а не с диска Что-то вроде input1 = PdfFileReader(file("http://example.com/a.pdf", "rb"))Я хочу открыть несколько файлов из Интернета и загрузить объединение всех файлов.