PDFBox pdf to image erzeugt überlappenden Text

Question

Jun 16, 2014, 07:52 AM

PDFBox pdf to image erzeugt überlappenden Text

Für ein Nebenprojekt habe ich angefangen, PDFBox zu verwenden, um PDF-Dateien in Bilder umzuwandeln. Dies ist die PDF-Datei, mit der ich in eine Bilddatei konvertierehttps://bitcoin.org/bitcoin.pdf.

Dies ist der Code, den ich verwende. Es ist sehr einfacher Code, der PDFToImage aufruft. Aber die Ausgabe-JPG-Bilddatei sieht mit vielen Kommas und etwas überlappendem Text wirklich schlecht aus.

    String [] args_2 =  new String[7];
    String pdfPath = "C:\\bitcoin.pdf";
    args_2[0] = "-startPage";
    args_2[1] = "1";
    args_2[2] = "-endPage";
    args_2[3] = "1";
    args_2[4] = "-outputPrefix";
    args_2[5] = "my_image_2";
    //args_2[6] = "-resolution";
    //args_2[7] = "1000";
    args_2[6] = pdfPath;
    try {
        PDFToImage.main(args_2);
    } catch (Exception e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }

Zu kommentieren