Java 如何解析XML标记之外的文本?

Java 如何解析XML标记之外的文本?,java,xml,xml-parsing,Java,Xml,Xml Parsing,我想解析出现在XML文件中但在XML标记之外的文本。在所附示例中,我只想解析p标记之外的文本,例如“技术领域”和“技术详细说明” 我的XML文件的一个示例是: <description> FIELD OF THE TECHNOLOGY <p>The present technology is directed ....</p> <p>The present invention is.....</

我想解析出现在XML文件中但在XML标记之外的文本。在所附示例中,我只想解析
p
标记之外的文本,例如
“技术领域”
“技术详细说明”

我的XML文件的一个示例是:

<description>                        
FIELD OF THE TECHNOLOGY
<p>The present technology is directed ....</p>
<p>The present invention is.....</p>
<p>One promising approach has ...,</p>


DETAILED DESCRIPTION OF THE TECHNOLOGY
<p>The present tech provides, ....</p>
<p>A report by Kearse et al.,...</p>
</description>

技术领域
目前的技术是针对

本发明是

一个有希望的方法是

技术的详细说明 目前的技术提供

Kearse等人的报告

术语 在您的示例中,
description
元素具有混合内容。您希望提取
description
元素的文本节点子元素。确定正确的术语是寻找答案(并缩小过于宽泛的问题)的第一步

解析XML …一般使用Java

…混合内容:

…选择解析技术:

您可以在上找到许多教程,但是XPath特别适合于选择XML文档的某些部分,并且有适用于大多数语言的库

…通过XPath,例如:

这个XPath

//description/text()

将从
description
元素中选择所有直接文本节点子节点。它将不包括所要求的
p
元素或其后代

谢谢你的评论。