在Java中将Doc或Docx转换为HTML

在Java中将Doc或Docx转换为HTML,java,spring-mvc,apache-poi,Java,Spring Mvc,Apache Poi,如何在Java中将doc或docx转换为HTML。使用ApachePOI,我可以将doc转换为html,但无法将docx转换为html?请给我看看示例代码?此代码适用于doc,但不适用于docx HWPFDocumentCore wordDocument = WordToHtmlUtils.loadDoc(stream); WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(

如何在Java中将doc或docx转换为HTML。使用ApachePOI,我可以将doc转换为html,但无法将docx转换为html?请给我看看示例代码?此代码适用于doc,但不适用于docx

        HWPFDocumentCore wordDocument = WordToHtmlUtils.loadDoc(stream);

        WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(
                DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());
        wordToHtmlConverter.processDocument(wordDocument);
        Document htmlDocument = wordToHtmlConverter.getDocument();
        ByteArrayOutputStream out = new ByteArrayOutputStream();
        DOMSource domSource = new DOMSource(htmlDocument);
        StreamResult streamResult = new StreamResult(out);

        TransformerFactory tf = TransformerFactory.newInstance();
        Transformer serializer = tf.newTransformer();
        serializer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
        serializer.setOutputProperty(OutputKeys.INDENT, "yes");
        serializer.setOutputProperty(OutputKeys.METHOD, "html");
        serializer.transform(domSource, streamResult);
        out.close();

        String result = new String(out.toByteArray());

这没有理由不起作用

请审查以下内容:

简言之,确保您使用的是最新版本的POI,并且具有所有必需的库


如果您需要额外的帮助,请解释什么不起作用。您是否遇到编译时错误?运行时错误?意外输出?

谢谢。您的链接只是显示了如何提取docx,但我需要将docx转换为html。@user960567-您是如何将*.doc转换为html的?使用*.docx真的不应该有什么不同。您尝试了什么,在哪里遇到了问题?您可以使用docx4j来解决这个问题,请参见示例:@user960567,我也遇到了同样的问题。您找到解决方案了吗?@jnrdn0011搜索Office Open Xml谢谢,我终于找到了解决方案。