PDFBox pdf to image erzeugt überlappenden Text
Für ein Nebenprojekt habe ich angefangen, PDFBox zu verwenden, um PDF-Dateien in Bilder umzuwandeln. Dies ist die PDF-Datei, mit der ich in eine Bilddatei konvertierehttps://bitcoin.org/bitcoin.pdf.
Dies ist der Code, den ich verwende. Es ist sehr einfacher Code, der PDFToImage aufruft. Aber die Ausgabe-JPG-Bilddatei sieht mit vielen Kommas und etwas überlappendem Text wirklich schlecht aus.
String [] args_2 = new String[7];
String pdfPath = "C:\\bitcoin.pdf";
args_2[0] = "-startPage";
args_2[1] = "1";
args_2[2] = "-endPage";
args_2[3] = "1";
args_2[4] = "-outputPrefix";
args_2[5] = "my_image_2";
//args_2[6] = "-resolution";
//args_2[7] = "1000";
args_2[6] = pdfPath;
try {
PDFToImage.main(args_2);
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}