操作html文档 …您好。。。
我想从html文档中删除操作html文档 …您好。。。,html,html-parsing,jsoup,html-manipulation,Html,Html Parsing,Jsoup,Html Manipulation,我想从html文档中删除标记。可以使用Jsoup吗 ...<b><a>hello</a></b>... 从如果doc文档是否包含HTML: public String clean(String unsafe){ Whitelist whitelist = Whitelist.none(); whitelist.addTags(new String[]{"a"}); String safe =
标记。可以使用Jsoup吗
...<b><a>hello</a></b>...
从如果
doc
文档是否包含HTML:
public String clean(String unsafe){
Whitelist whitelist = Whitelist.none();
whitelist.addTags(new String[]{"a"});
String safe = Jsoup.clean(unsafe, whitelist);
return StringEscapeUtils.unescapeXml(safe);
}
(也可与元素
/元素
一起使用)
示例:
doc.select("b").unwrap();
文件文件=新文件(“”);
html(“…您好…”)。选择(“b”).unwrap();
现在,您的文档不包含任何b标签
Document document = new Document("");
document.html("...<b><a>hello</a></b>...").select("b").unwrap();