Potrzebuję zdjęć Apache POI przekonwertowanych z dokumentu tekstowego na plik html
Mam jakiś kod, który używa biblioteki Java Apache POI do otwarcia dokumentu Microsoft Word i przekonwertowania go na html, używając POI Apache, a także pobiera dane tablicy bajtów obrazów na dokumencie. Ale muszę przekonwertować te informacje na html, aby napisać do pliku html. Wszelkie wskazówki i sugestie będą mile widziane. Pamiętaj, że jestem programistą zajmującym się komputerami osobistymi, a nie programistą internetowym, więc kiedy robisz sugestie, pamiętaj o tym. Poniższy kod pobiera obraz.
private void parseWordText(File file) throws IOException {
FileInputStream fs = new FileInputStream(file);
doc = new HWPFDocument(fs);
PicturesTable picTable = doc.getPicturesTable();
if (picTable != null){
picList = new ArrayList<Picture>(picTable.getAllPictures());
if (!picList.isEmpty()) {
for (Picture pic : picList) {
byte[] byteArray = pic.getContent();
pic.suggestFileExtension();
pic.suggestFullFileName();
pic.suggestPictureType();
pic.getStartOffset();
}
}
}
Następnie poniższy kod konwertuje dokument na HTML. Czy istnieje sposób, aby dodać bajtArray do ByteArrayOutputStream w poniższym kodzie?
private void convertWordDoctoHTML(File file) throws ParserConfigurationException, TransformerConfigurationException, TransformerException, IOException {
HWPFDocumentCore wordDocument = null;
try {
wordDocument = WordToHtmlUtils.loadDoc(new FileInputStream(file));
} catch (IOException ex) {
Exceptions.printStackTrace(ex);
}
WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());
wordToHtmlConverter.processDocument(wordDocument);
org.w3c.dom.Document htmlDocument = wordToHtmlConverter.getDocument();
NamedNodeMap node = htmlDocument.getAttributes();
ByteArrayOutputStream out = new ByteArrayOutputStream();
DOMSource domSource = new DOMSource(htmlDocument);
StreamResult streamResult = new StreamResult(out);
TransformerFactory tf = TransformerFactory.newInstance();
Transformer serializer = tf.newTransformer();
serializer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
serializer.setOutputProperty(OutputKeys.INDENT, "yes");
serializer.setOutputProperty(OutputKeys.METHOD, "html");
serializer.transform(domSource, streamResult);
out.close();
String result = new String(out.toByteArray());
acDocTextArea.setText(newDocText);
htmlText = result;
}