Получить номера страниц из документа с помощью PyPDF

На данный момент яЯ собираюсь выполнить слияние PDF с pyPdf, но иногда входные данные не в правильном порядке, поэтому яЯ пытаюсь разобрать каждую страницу по номеру страницы, чтобы определить, в каком порядке она должна идти (например, если кто-то разделил книгу на 20 10-страничных PDF-файлов, и я хочу собрать их вместе).

У меня есть два вопроса - 1.) Я знаю, что иногда номер страницы хранится где-то в данных документа, как ямы видели PDF-файлы, которые отображаются в Adobe как что-то вроде [1243] (10 из 150), но яя прочитал документы такого рода в pyPDF, и я могуt найти какую-либо информацию, указывающую номер страницы - где она хранится?

2.) Если проспект № 1 неЯ думаю, что если бы это было доступно, я мог бы перебирать объекты на данной странице, чтобы попытаться найти номер страницы - скорее всего, это был бы его собственный объект с одним номером. Тем не менее, я могуКажется, я не нашел четкого способа определить содержание объектов. Если я бегу:

pdf.getPage(0).getContents()

Это обычно либо возвращает:

{'/Filter': '/FlateDecode'}

или он возвращает список объектов IndirectObject (num, num). Я нене знаю, что делать с любым из них и тамНасколько я могу судить, никакой реальной документации по этому вопросу нет. Кто-нибудь знаком с такими вещами, которые могут указать мне правильное направление?

Ответы на вопрос(4)

Ваш ответ на вопрос