Suchergebnisse für Anfrage "pypdf"

2 die antwort

Highlight-Text in einer PDF-Datei mit Python [closed]

Ich arbeite an einer benutzerdefinierten Suchmaschine für meinen PDF-Datenkorpus. Ich habe eine Transformationsebene, mit der PDF-Inhalte in Text umgewandelt werden können (mit Apache Tika und GROBID). Ich habe die Suchebenen und die Ansicht ...

3 die antwort

PyPDF2 wird nicht importiert

Hallo, ich fange gerade mit Python an und versuche, einige erforderliche Bibliotheken zu installieren. Verwenden von Python 3.4.1 unter OS X. Ich habe PyPDF2 (mit vermeintlichem Erfolg) installiert, kann die folgenden Tools jedoch nicht ...

4 die antwort

Leerzeichen durch PDF-Extraktion und seltsame Wortinterpretation

Ich habe versucht, die Textdaten mit dem folgenden Snippet zu extrahierendiese PDF Datei.

TOP-Veröffentlichungen

4 die antwort

Wie installiere ich das pyPDF2-Modul unter Windows?

Als Neuling ... habe ich Schwierigkeiten, das pyPDF2-Modul zu installieren. Ich habe heruntergeladen. Wo und wie installiere ich (setup.py), damit ich das Modul im Python-Interpreter verwenden kann?

2 die antwort

pyPdf ignoriert Zeilenumbrüche in PDF-Dateien

Ich versuche, jede Seite einer PDF-Datei als Zeichenfolge zu extrahieren:

2 die antwort

PDF - Weiße Ränder entfernen

Ich möchte einen Weg kennen, um weiße Ränder aus einer PDF-Datei zu entfernen. Genau wie Adobe Acrobat X Pro. Ich verstehe, dass es nicht mit jeder PDF-Datei...

2 die antwort

Wie kann ich mit einem Befehlszeilentool ein JavaScript aus einer PDF-Datei extrahieren?

Wie kann ich ein JavaScript-Objekt mit einem Befehlszeilentool aus einer PDF-Datei extrahieren? Ich versuche, mit dieser Funktion eine grafische Benutzeroberfläche mit Python zu erstellen. Ich habe diese beiden Module gefunden, konnte sie ...

13 die antwort

Bilder aus PDF extrahieren, ohne sie neu abzutasten, in Python?

Wie kann man alle Bilder aus einem PDF-Dokument in nativer Auflösung und Format extrahieren? (Das heißt, extrahiere tiff als tiff, jpeg als jpeg usw. und ohne Resampling). Das Layout ist unwichtig, es ist mir egal, wo sich das Quellbild auf der ...

4 die antwort

pypdf Zusammenführen mehrerer PDF-Dateien zu einem PDF

Wenn ich mehr als 1000 PDF-Dateien habe, müssen diese zu einem PDF zusammengefügt werden.

4 die antwort

Seitenzahlen aus dem Dokument mit pyPDF abrufen

Momentan bin ich mit dem Zusammenführen von PDF-Dateien mit pyPdf beschäftigt, aber manchmal sind die Eingaben nicht in der richtigen Reihenfolge. Daher scha...