Java 解析字符串形式的HTML转储的有效方法_Java_Html Parsing_Jsoup_Htmleditorkit

Java 解析字符串形式的HTML转储的有效方法

java

Java 解析字符串形式的HTML转储的有效方法,java,html-parsing,jsoup,htmleditorkit,Java,Html Parsing,Jsoup,Htmleditorkit,请处理这个琐碎的问题。它在stackoverflow上以零碎的形式提供我有一个网站的HTML转储字符串的形式。我想从它的特定标签中提取文本换句话说，我想模仿 Document doc = Jsoup.connect(url).userAgent("Mozilla").get(); Elements links = doc.getElementsByTag("cite"); 我没有使用Jsoup，因为我不想让它连接到网站（我有另一个以文本形式返回html转储的服务）。我找到了将文本转换为HT

请处理这个琐碎的问题。它在stackoverflow上以零碎的形式提供

我有一个网站的HTML转储字符串的形式。我想从它的特定标签中提取文本

换句话说，我想模仿

Document doc = Jsoup.connect(url).userAgent("Mozilla").get();
Elements links = doc.getElementsByTag("cite");

我没有使用Jsoup，因为我不想让它连接到网站（我有另一个以文本形式返回html转储的服务）。我找到了将文本转换为HTMLDocument的方法，但它似乎不太容易使用（如Jsoup或HTMLParser），或者我无法获得它

任何帮助都是有用的

谢谢。

如果您已经使用了Jsoup，并且它仍然有效，那么您应该继续使用它

Document doc = Jsoup.parse("<html>...");

documentdoc=Jsoup.parse（“…”）；

应该这样做

请参阅：

或者更全面地说，

documentdoc=Jsoup.parse（myHtmlString）非常感谢！！：）我真傻，竟然不尝试！