用java阅读microsoft word文档

用java阅读microsoft word文档,java,file-handling,Java,File Handling,有没有一种不用ApachePOI包就可以用java阅读MicrosoftWord文档的简单方法 或者,除了不使用Apache POI包实现同样的功能,还有什么其他替代方案呢?有一种商业替代方案,它非常易于使用,但也是商业的-java docx?它不是用于阅读,而是用于生成动态输出。有点像。如果它是WordML文件,您可以解压缩它,然后手动从其中的XML文件中提取数据,但是相信我,这不是一个令人愉快的过程。当我们在我的公司尝试这样做时,我们曾希望能够利用一些OOo库来清理文档,但效果不太好。可能会

有没有一种不用ApachePOI包就可以用java阅读MicrosoftWord文档的简单方法


或者,除了不使用Apache POI包实现同样的功能,还有什么其他替代方案呢?

有一种商业替代方案,它非常易于使用,但也是商业的-

java docx?它不是用于阅读,而是用于生成动态输出。

有点像。如果它是WordML文件,您可以解压缩它,然后手动从其中的XML文件中提取数据,但是相信我,这不是一个令人愉快的过程。当我们在我的公司尝试这样做时,我们曾希望能够利用一些OOo库来清理文档,但效果不太好。

可能会有所帮助。

这也是从docx文件中提取的吗?是的。docx是一个归档文件,如果您提取它,您可以看到许多文件,其中的某个地方将是xml。。我没用过,只是读了一点。对不起,我以前深入研究过docx文件,我只是想知道那个库除了写它们之外是否还能读它们。你说的“读”是什么意思?MS Office最新版本的Word文档是与zip兼容的包,其中包含与文档基于文本的内容相对应的XML文档-您可以使用Java的zip和XML库阅读这些文档…这里有一个很好的链接: