Java jsoup解析非典型标记
我是否可以使用jsoup解析非标准标记,例如Java jsoup解析非典型标记,java,jsoup,Java,Jsoup,我是否可以使用jsoup解析非标准标记,例如、或 这是我的语料库中的一个示例句子: I HAD been hearing about vineyards in <LOCATION>Malibu</LOCATION> for some time, but I wrote them off. Had to be a tourist gimmick, like <PERSON>Knott</PERSON>'s <ORGANIZATION&g
、
或
这是我的语料库中的一个示例句子:
I HAD been hearing about vineyards in <LOCATION>Malibu</LOCATION> for some time,
but I wrote them off. Had to be a tourist gimmick, like
<PERSON>Knott</PERSON>'s <ORGANIZATION>Berry Farm</ORGANIZATION>
or the LaBrea Tar Pits. <LOCATION>Malibu</LOCATION> was the playground of the stars,
a surfers' mecca, but cabernet? No way.
如果它不是HTML规范的一部分,默认的
parse
方法将不会处理自定义标记
但是,您可以告诉JSoup将其解析为XML:
Jsoup.parse(yourHtml, baseUriForLinks, Parser.xmlParser());
上面的命令将返回一个文档
,您可以在其中使用自定义标记进行操作
其中:
yourHtml
-自定义标记为字符串的HTML
baseUriForLinks
-HTML的基本URL(以便JSoup可以解析相关链接(如果有)也作为String
如果它不是HTML规范的一部分,默认的parse
方法将不会处理自定义标记
但是,您可以告诉JSoup将其解析为XML:
Jsoup.parse(yourHtml, baseUriForLinks, Parser.xmlParser());
上面的命令将返回一个文档
,您可以在其中使用自定义标记进行操作
其中:
yourHtml
-自定义标记为字符串的HTML
baseUriForLinks
-HTML的基本URL(以便JSoup可以解析相关链接(如果有)也作为String
如果它不是HTML规范的一部分,默认的parse
方法将不会处理自定义标记
但是,您可以告诉JSoup将其解析为XML:
Jsoup.parse(yourHtml, baseUriForLinks, Parser.xmlParser());
上面的命令将返回一个文档
,您可以在其中使用自定义标记进行操作
其中:
yourHtml
-自定义标记为字符串的HTML
baseUriForLinks
-HTML的基本URL(以便JSoup可以解析相关链接(如果有)也作为String
如果它不是HTML规范的一部分,默认的parse
方法将不会处理自定义标记
但是,您可以告诉JSoup将其解析为XML:
Jsoup.parse(yourHtml, baseUriForLinks, Parser.xmlParser());
上面的命令将返回一个文档
,您可以在其中使用自定义标记进行操作
其中:
yourHtml
-自定义标记为字符串的HTML
baseUriForLinks
-HTML的基本URL(以便JSoup可以解析相关链接(如果存在)也作为String