Tabelle aus einem PDF extrahieren

Ich versuche eine Tabelle aus einem PDF zu extrahierendokumentieren

Ich habe den Weg von pdf -> html -> Extrakttabelle ausprobiert. Das PDF, das ich oben erwähnte, wenn es in HTML konvertiert wurde, produziert Müll. Vielleicht liegt es an der Schriftart, dass das Dokument nicht in Englisch ist.

Das Extrahieren der PDF-Datei mit x- und y-Koordinaten ist keine Option, da diese Lösung für zukünftige PDF-Dateien aus der oben genannten URL funktionieren muss, bei denen sich die Tabelle jedoch nicht immer an derselben Position befindet.

Bitte helfen Sie,

Danke im Voraus.

Antworten auf die Frage(3)

Ihre Antwort auf die Frage