Wyodrębnij tabelę z pliku PDF

Próbuję wyodrębnić tabelę z pliku pdfdokument

Próbowałem trasy pdf -> html -> tabeli wyciągu. Plik pdf, o którym wspomniałem powyżej po konwersji na html, powoduje śmieci, może z powodu czcionki, dokument nie jest w języku angielskim.

Wyodrębnianie pliku PDF przy użyciu współrzędnych xiy nie jest opcją, ponieważ to rozwiązanie musi działać w przyszłości w formacie pdf z adresu URL wymienionego powyżej, który będzie miał tabelę, ale nie zawsze w tej samej pozycji.

Proszę pomóż,

Z góry dziękuję.

questionAnswers(3)

yourAnswerToTheQuestion