Wyodrębnij tabelę z pliku PDF
Próbuję wyodrębnić tabelę z pliku pdfdokument
Próbowałem trasy pdf -> html -> tabeli wyciągu. Plik pdf, o którym wspomniałem powyżej po konwersji na html, powoduje śmieci, może z powodu czcionki, dokument nie jest w języku angielskim.
Wyodrębnianie pliku PDF przy użyciu współrzędnych xiy nie jest opcją, ponieważ to rozwiązanie musi działać w przyszłości w formacie pdf z adresu URL wymienionego powyżej, który będzie miał tabelę, ale nie zawsze w tej samej pozycji.
Proszę pomóż,
Z góry dziękuję.