Extrahieren von Text aus einer PDF-Datei mit PDFMiner in Python?
Python Version 2.7
Ich suche Dokumentationode Beispiele zum Extrahieren von Text aus einer PDF-Datei mit PDFMiner mit Python.
Es sieht so aus, als ob PDFMiner seine API aktualisiert hat und alle relevanten Beispiele, die ich gefunden habe, veralteten Code enthalten (Klassen und Methoden haben sich geändert). Die Bibliotheken, die ich gefunden habe, um das Extrahieren von Text aus einer PDF-Datei zu vereinfachen, verwenden die alte PDFMiner-Syntax, daher bin ich mir nicht sicher, wie ich das tun soll.
Also schaue ich mir nur den Quellcode an, um zu sehen, ob ich es herausfinden kann.