Мне нужны Apache POI Изображения, преобразованные из текстового документа в HTML-файл

Question

Oct 30, 2012, 01:58 PM

Мне нужны Apache POI Изображения, преобразованные из текстового документа в HTML-файл

У меня есть некоторый код, который использует библиотеку Java Apache POI, чтобы открыть документ Microsoft Word и преобразовать его в HTML, используя Apache POI, и он также получает данные байтового массива изображений в документе. Но мне нужно преобразовать эту информацию в HTML, чтобы записать в файл HTML. Любые намеки или предложения будут оценены. Имейте в виду, что я разработчик для настольных ПК, а не веб-программист, поэтому, когда вы делаете предложения, помните об этом. Код ниже получает изображение.

 private void parseWordText(File file) throws IOException {
      FileInputStream fs = new FileInputStream(file);
      doc = new HWPFDocument(fs);
      PicturesTable picTable = doc.getPicturesTable();
      if (picTable != null){
           picList = new ArrayList(picTable.getAllPictures());
           if (!picList.isEmpty()) {
           for (Picture pic : picList) {
                byte[] byteArray = pic.getContent();
                pic.suggestFileExtension();
                pic.suggestFullFileName();
                pic.suggestPictureType();
                pic.getStartOffset();
           }
        }
     }

Затем код ниже этого преобразует документ в HTML. Есть ли способ добавить byteArray к ByteArrayOutputStream в коде ниже?

private void convertWordDoctoHTML(File file) throws ParserConfigurationException, TransformerConfigurationException, TransformerException, IOException {
    HWPFDocumentCore wordDocument = null;
    try {
        wordDocument = WordToHtmlUtils.loadDoc(new FileInputStream(file));
    } catch (IOException ex) {
        Exceptions.printStackTrace(ex);
    }

    WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());
    wordToHtmlConverter.processDocument(wordDocument);
    org.w3c.dom.Document htmlDocument = wordToHtmlConverter.getDocument();
    NamedNodeMap node = htmlDocument.getAttributes();


    ByteArrayOutputStream out = new ByteArrayOutputStream();
    DOMSource domSource = new DOMSource(htmlDocument);
    StreamResult streamResult = new StreamResult(out);

    TransformerFactory tf = TransformerFactory.newInstance();
    Transformer serializer = tf.newTransformer();
    serializer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
    serializer.setOutputProperty(OutputKeys.INDENT, "yes");
    serializer.setOutputProperty(OutputKeys.METHOD, "html");
    serializer.transform(domSource, streamResult);
    out.close();

    String result = new String(out.toByteArray());
    acDocTextArea.setText(newDocText);

    htmlText = result;

}

Мне нужны Apache POI Изображения, преобразованные из текстового документа в HTML-файл

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Мне нужны Apache POI Изображения, преобразованные из текстового документа в HTML-файл

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы