analizować plik PDF za pomocą Pythona

Mam plik pdf. Zawiera cztery kolumny, a wszystkie strony nie mają linii siatki. Są to oceny uczniów.

Chciałbym przeprowadzić analizę tej dystrybucji (histogramy, wykresy liniowe itp.).

Chcę przetworzyć ten plik pdf w arkusz kalkulacyjny lub plik HTML (który można następnie bardzo łatwo przeanalizować).

Link do pliku PDF to:

Pdf

jest to dokument publiczny i jest dostępny dla wszystkich w tej domenie.

Uwaga: Wiem, że można to zrobić, eksportując plik do tekstu z czytnika Adobe, a następnie importując go do Libre Calc lub Excel. Ale chcę to zrobić za pomocą skryptu Pythona.

Proszę mi pomóc z tym problemem. specyfikacje: Windows 7 Python 2.7

questionAnswers(1)

yourAnswerToTheQuestion