Python PDFMIner - PDF zu CSV

Ich möchte in der Lage sein, PDFs in CSV-Dateien zu konvertieren und habe einige nützliche Skripte gefunden, aber als Python-Neuling habe ich eine Frage:

Wo legen Sie den Dateipfad der PDF-Datei und die CSV-Datei fest, auf die Sie drucken möchten?

Ich verwende Python 2.7.11 und PDFMiner 20140328.

import sys
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.pdfpage import PDFPage
from pdfminer.converter import XMLConverter, HTMLConverter, TextConverter
from pdfminer.layout import LAParams
from cStringIO import StringIO

def pdfparser(data):

    fp = file(data, 'rb')
    rsrcmgr = PDFResourceManager()
    retstr = StringIO()
    codec = 'utf-8'
    laparams = LAParams()
    device = TextConverter(rsrcmgr, retstr, codec=codec, laparams=laparams)
    interpreter = PDFPageInterpreter(rsrcmgr, device)


    for page in PDFPage.get_pages(fp):
    interpreter.process_page(page)
    data =  retstr.getvalue()

    print data

if __name__ == '__main__':
pdfparser(sys.argv[1]) 

Antworten auf die Frage(2)

Ihre Antwort auf die Frage