Java 解析字符串形式的HTML转储的有效方法
请处理这个琐碎的问题。它在stackoverflow上以零碎的形式提供 我有一个网站的HTML转储字符串的形式。我想从它的特定标签中提取文本 换句话说,我想模仿Java 解析字符串形式的HTML转储的有效方法,java,html-parsing,jsoup,htmleditorkit,Java,Html Parsing,Jsoup,Htmleditorkit,请处理这个琐碎的问题。它在stackoverflow上以零碎的形式提供 我有一个网站的HTML转储字符串的形式。我想从它的特定标签中提取文本 换句话说,我想模仿 Document doc = Jsoup.connect(url).userAgent("Mozilla").get(); Elements links = doc.getElementsByTag("cite"); 我没有使用Jsoup,因为我不想让它连接到网站(我有另一个以文本形式返回html转储的服务)。我找到了将文本转换为HT
Document doc = Jsoup.connect(url).userAgent("Mozilla").get();
Elements links = doc.getElementsByTag("cite");
我没有使用Jsoup,因为我不想让它连接到网站(我有另一个以文本形式返回html转储的服务)。我找到了将文本转换为HTMLDocument的方法,但它似乎不太容易使用(如Jsoup或HTMLParser),或者我无法获得它
任何帮助都是有用的
谢谢。如果您已经使用了Jsoup,并且它仍然有效,那么您应该继续使用它
Document doc = Jsoup.parse("<html>...");
documentdoc=Jsoup.parse(“…”);
应该这样做
请参阅:或者更全面地说,
documentdoc=Jsoup.parse(myHtmlString)代码>非常感谢!!:)我真傻,竟然不尝试!