Java jsoup解析非典型标记

Java jsoup解析非典型标记,java,jsoup,Java,Jsoup,我是否可以使用jsoup解析非标准标记,例如、或 这是我的语料库中的一个示例句子: I HAD been hearing about vineyards in <LOCATION>Malibu</LOCATION> for some time, but I wrote them off. Had to be a tourist gimmick, like <PERSON>Knott</PERSON>'s <ORGANIZATION&g

我是否可以使用jsoup解析非标准标记,例如

这是我的语料库中的一个示例句子:

I HAD been hearing about vineyards in <LOCATION>Malibu</LOCATION> for some time,  
but I wrote them off. Had to be a tourist gimmick, like  
<PERSON>Knott</PERSON>'s <ORGANIZATION>Berry Farm</ORGANIZATION>  
or the LaBrea Tar Pits. <LOCATION>Malibu</LOCATION> was the playground of the stars,  
a surfers' mecca, but cabernet? No way.

如果它不是HTML规范的一部分,默认的
parse
方法将不会处理自定义标记

但是,您可以告诉JSoup将其解析为XML:

Jsoup.parse(yourHtml, baseUriForLinks, Parser.xmlParser());
上面的命令将返回一个
文档
,您可以在其中使用自定义标记进行操作

其中:

yourHtml
-自定义标记为
字符串的HTML


baseUriForLinks
-HTML的基本URL(以便JSoup可以解析相关链接(如果有)也作为
String

如果它不是HTML规范的一部分,默认的
parse
方法将不会处理自定义标记

但是,您可以告诉JSoup将其解析为XML:

Jsoup.parse(yourHtml, baseUriForLinks, Parser.xmlParser());
上面的命令将返回一个
文档
,您可以在其中使用自定义标记进行操作

其中:

yourHtml
-自定义标记为
字符串的HTML


baseUriForLinks
-HTML的基本URL(以便JSoup可以解析相关链接(如果有)也作为
String

如果它不是HTML规范的一部分,默认的
parse
方法将不会处理自定义标记

但是,您可以告诉JSoup将其解析为XML:

Jsoup.parse(yourHtml, baseUriForLinks, Parser.xmlParser());
上面的命令将返回一个
文档
,您可以在其中使用自定义标记进行操作

其中:

yourHtml
-自定义标记为
字符串的HTML


baseUriForLinks
-HTML的基本URL(以便JSoup可以解析相关链接(如果有)也作为
String

如果它不是HTML规范的一部分,默认的
parse
方法将不会处理自定义标记

但是,您可以告诉JSoup将其解析为XML:

Jsoup.parse(yourHtml, baseUriForLinks, Parser.xmlParser());
上面的命令将返回一个
文档
,您可以在其中使用自定义标记进行操作

其中:

yourHtml
-自定义标记为
字符串的HTML

baseUriForLinks
-HTML的基本URL(以便JSoup可以解析相关链接(如果存在)也作为
String