Wie finde ich Tabellenrandlinien in PDF mit PDFBox?

Ich versuche, Tabellenrandlinien im PDF-Format zu finden. Ich benutztePrintTextLocations Klasse von pdfBox, um Wörter zu machen. Jetzt suche ich die Koordinaten der verschiedenen Linien, die die Tabelle bilden. Ich habe versucht mitorg.apache.pdfbox.pdfviewer.PageDrawer, aber ich kann keine Zeichen / Grafiken finden, die diese Zeilen enthalten. Ich habe zwei Möglichkeiten ausprobiert:

Zuerst

Graphics g = null;
Dimension d = new Dimension();
d.setSize(700, 700);
PageDrawer pageDrawer = new PageDrawer();
pageDrawer.drawPage(g, myPage, d);

Es gab mir Nullzeiger Ausnahme. Zweitens habe ich versucht, @ zu überschreibeprocessStream Funktion, aber ich kann keinen Schlaganfall bekommen. Bitte hilf mir raus. Ich kann jede andere Bibliothek verwenden, die mir die Koordinaten der Zeilen in der Tabelle angibt. Und noch eine kurze Frage: Was für Objekte sind diese Tabellenrandlinien in pdfbox? Handelt es sich um Grafiken oder um Zeichen?

Hier ist der Link zum Beispiel-PDF, das ich zu analysieren versuche:http: //stats.bls.gov/news.release/pdf/empsit.pd und versuchen, die Tabellenzeilen auf Seite 8 zu erhalten.

Bearbeite: Beim Parsen der Seite 1 dieses PDFs trat ein anderes Problem auf. Ich kann jedoch keine Zeilen als @ abrufepathIterator imprintPath() Funktion ist leer, obwohlstrokePath()ür jede Zeile wird die @ -Funktion aufgerufen. Wie arbeite ich mit diesem PDF?

Antworten auf die Frage(2)

Ihre Antwort auf die Frage