Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/windows/16.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在java中按节读取文件内容_Java_Windows - Fatal编程技术网

在java中按节读取文件内容

在java中按节读取文件内容,java,windows,Java,Windows,我想阅读任何文件的内容,如java中的doc、pdf、ppt等部分或段落,因为我想检索文件的特定部分(如果有的话),而不是检索整个文件的内容。。请任何人告诉我,我如何阅读任何文件的内容,无论是章节还是段落 谢谢这完全取决于相关文件的格式。例如,当您有一个.docx文件时,您可以使用一些XML解析器,然后遍历结果,或者使用XPath查找所有段落、节或任何您希望提取的内容 对于其他文件格式,您必须找到不同的方法。提取任何文件的特定部分没有单一的方法,因为不同的文件类型有不同的数据存储方式。最可能的情

我想阅读任何文件的内容,如java中的doc、pdf、ppt等部分或段落,因为我想检索文件的特定部分(如果有的话),而不是检索整个文件的内容。。请任何人告诉我,我如何阅读任何文件的内容,无论是章节还是段落


谢谢

这完全取决于相关文件的格式。例如,当您有一个
.docx
文件时,您可以使用一些XML解析器,然后遍历结果,或者使用XPath查找所有段落、节或任何您希望提取的内容


对于其他文件格式,您必须找到不同的方法。提取任何文件的特定部分没有单一的方法,因为不同的文件类型有不同的数据存储方式。最可能的情况是,您必须收集一组库,每种文件类型一个库。

您提到的每种文件格式(doc、pdf等)都完全是文件格式。您必须为您想要支持的每种文件格式找到或编写一个解析器/处理器。感谢Swapnil和Forsythe……。我已经用java进行了尝试,能够一次提取全部内容,但我希望检索分段内容而不是全部内容。如何为文件编写解析器。是否可以编写自动解析器,它可以解析任何格式的任何文件。