如何使用java打开.doc或.docx文件并检查文本格式

如何使用java打开.doc或.docx文件并检查文本格式,java,docx,doc,Java,Docx,Doc,我想用java打开一个.doc(或.docx)文件,检查部分文本的字体系列、部分文本的字体大小、表格和表格说明、右缩进、左缩进等(如下图所示) java中是否有用于此的库和.jar文件?我怎样才能把它用于我的目的呢?你可以看看。它是一个功能强大的库,用于创建和编辑microsoft office文档。但如果您只需要检查doc或docx中的某些参数,您可以使用可能的“我要打开文件”副本,检查文本格式、右缩进和左缩进以及表格。Aspose.word和docx4j可以这样做吗?@MordechayS

我想用java打开一个.doc(或.docx)文件,检查部分文本的字体系列、部分文本的字体大小、表格和表格说明、右缩进、左缩进等(如下图所示)


java中是否有用于此的库和.jar文件?我怎样才能把它用于我的目的呢?

你可以看看。它是一个功能强大的库,用于创建和编辑microsoft office文档。但如果您只需要检查doc或docx中的某些参数,您可以使用

可能的“我要打开文件”副本,检查文本格式、右缩进和左缩进以及表格。Aspose.word和docx4j可以这样做吗?@MordechaySI想打开文件并检查文本格式、右缩进、左缩进和表格等。它可以这样做吗?@D.krauchankai如果您只想验证文档的一些参数,可以使用docx4j而不是apache poi。它将doc或docx转换为xml,然后您可以获得所需的所有属性这里是这个xml看起来像[link]()的示例,这里是如何获得表的缩进格式和表的描述,右缩进、左缩进更重要。哪一种(docx4j,Aspose.word,Apache POI)更好?@D.Krauchankain我的观点是,docx4j在您的情况下会更好,因为doc和docx格式都是编码的xml,docx4j可以解码这个xml,并且会有所有由microsoft word存储的参数