使用java读取docx文档
我有一个项目需要将使用java读取docx文档,java,apache-poi,docx,Java,Apache Poi,Docx,我有一个项目需要将docx文档隐藏到jpeg图像中。使用ApachePOI,我可以运行它并读取docx文档,但只能读取字母 即使里面有照片 这是密码 FileInputStream in = null; try { in = new FileInputStream(directory); XWPFDocument datax = new XWPFDocument(in); XWPFWordExtractor extract = ne
docx
文档隐藏到jpeg
图像中。使用ApachePOI,我可以运行它并读取docx
文档,但只能读取字母
即使里面有照片
这是密码
FileInputStream in = null;
try
{
in = new FileInputStream(directory);
XWPFDocument datax = new XWPFDocument(in);
XWPFWordExtractor extract = new XWPFWordExtractor(datax);
String DataFinal = extract.getText();
BufferedReader reader = new BufferedReader(new InputStreamReader(in));
String line = null;
this.isi_file = extract.getText();
}
catch (IOException x) {}
System.out.println("isi :" + this.isi_file);
如何使用java读取docx文档中的所有组件?请帮助我,谢谢你的帮助。请查看XWPFDocument
课程。它包含一些有用的方法,例如:
- 返回文档中所有图片的列表李>
- 返回文档中所有表的列表
XWPFDocument datax=newxwpfdocument(In)代码>。因此,在这一行之后,您可以编写如下代码:
// process all pictures in document
for (XWPFPictureData picture : datax.getAllPictures()) {
// get each picture as byte array
byte[] pictureData = picture.getData();
// process picture somehow
...
}
docx文件和其他任何文件一样,都是一堆字节。当由适当的解码器读取时,您可以正确地查看文本和图像。但是就隐藏文件而言,只需读取字节数组中的文件。代码如何?什么代码?按照我的建议去做?它以前被报道过。搜索如何将文件读入字节数组。如何使其成为代码?我不明白那个文档中的意思。@Apuranic,我编辑了我的答案,并添加了一些小代码片段,演示如何处理文档中的图片。希望这有帮助。@Apuranic,输出什么?请提供具体的代码片段,因为我的示例不完整,如果没有您的修改,甚至无法编译。哦,我明白了,很抱歉误解您,谢谢您的帮助:)