Java 由于'&';HTML中的字符

Java 由于'&';HTML中的字符,java,xml,saxparser,Java,Xml,Saxparser,我试图用org.jdom2.input.SAXBuilder用Java解析XML文档(实际上是HMTL,但这并不重要) 该文档包含一行URL: < link rel ="something" href="http://...&pg=2..." />; &是一种特殊的XML字符。您需要将其转移到&;或者将其环绕在CDATA[]标记上 我试图解析一个XML文档(实际上是HMTL),但事实并非如此 物质)在java中 这很重要!如果使用XML编辑器验证HTML源文件。它是否

我试图用org.jdom2.input.SAXBuilder用Java解析XML文档(实际上是HMTL,但这并不重要)

该文档包含一行URL:

< link rel ="something" href="http://...&pg=2..." />;

&是一种特殊的XML字符。您需要将其转移到&;或者将其环绕在CDATA[]标记上

我试图解析一个XML文档(实际上是HMTL),但事实并非如此 物质)在java中

这很重要!如果使用XML编辑器验证HTML源文件。它是否抱怨同样的问题?它是XML格式良好的吗


请记住,许多HTML源不是格式良好的XML。如果您想解析HTML,那么我建议您使用HTML解析器。我在我的许多项目中使用了JSoup(开源)api来解析HTML。

&是一个特殊的XML字符。您需要将其转移到&;或者将其环绕在CDATA[]标记上

我试图解析一个XML文档(实际上是HMTL),但事实并非如此 物质)在java中

这很重要!如果使用XML编辑器验证HTML源文件。它是否抱怨同样的问题?它是XML格式良好的吗


请记住,许多HTML源不是格式良好的XML。如果您想解析HTML,那么我建议您使用HTML解析器。我在我的许多项目中使用了JSoup(开源)api来解析HTML;这是JSout parce到某个jdom元素,这样您就可以导航到元素了吗?JSoup是Apache项目,开源的。它用于解析HTML并导航DOM。您可以选择各种节点、属性并提取它们的数据……是的,例如netbeans xml编辑器编写相同的内容;这是JSout parce到某个jdom元素,这样您就可以导航到元素了吗?JSoup是Apache项目,开源的。它用于解析HTML并导航DOM。您可以选择各种节点、属性并提取它们的数据。。。
org.jdom2.input.SAXBuilder