analizować plik PDF za pomocą Pythona
Mam plik pdf. Zawiera cztery kolumny, a wszystkie strony nie mają linii siatki. Są to oceny uczniów.
Chciałbym przeprowadzić analizę tej dystrybucji (histogramy, wykresy liniowe itp.).
Chcę przetworzyć ten plik pdf w arkusz kalkulacyjny lub plik HTML (który można następnie bardzo łatwo przeanalizować).
Link do pliku PDF to:
jest to dokument publiczny i jest dostępny dla wszystkich w tej domenie.
Uwaga: Wiem, że można to zrobić, eksportując plik do tekstu z czytnika Adobe, a następnie importując go do Libre Calc lub Excel. Ale chcę to zrobić za pomocą skryptu Pythona.
Proszę mi pomóc z tym problemem. specyfikacje: Windows 7 Python 2.7