Java 如何提取特定的ownText JSOUP String html=“

Java 如何提取特定的ownText JSOUP String html=“,java,jsoup,Java,Jsoup,链接。”; Document doc=Jsoup.parse(html); Element link=doc.select(“a”).first(); 字符串text=doc.body().text();//“示例链接” 字符串linkHref=link.attr(“href”);//"http://example.com/" 字符串linkText=link.text();//“示例” 字符串linkOuterH=link.outerHtml(); // "" 字符串linkInnerH=li

链接。

”; Document doc=Jsoup.parse(html); Element link=doc.select(“a”).first(); 字符串text=doc.body().text();//“示例链接” 字符串linkHref=link.attr(“href”);//"http://example.com/" 字符串linkText=link.text();//“示例” 字符串linkOuterH=link.outerHtml(); // "" 字符串linkInnerH=link.html();/“示例”
在本例中,我只想提取“An”、“link”等。例如,我想获取节点ie“An”之前的文本,以及节点ie“link”之后的文本。在上述示例中,要获取段落的文本,请选择它并请求其自己的文本:

String html = "<p>An <a href='http://example.com/'><b>example</b></a> link.</p>";
Document doc = Jsoup.parse(html);
Element link = doc.select("a").first();

String text = doc.body().text(); // "An example link"
String linkHref = link.attr("href"); // "http://example.com/"
String linkText = link.text(); // "example""

String linkOuterH = link.outerHtml(); 
    // "<a href="http://example.com"><b>example</b></a>"
String linkInnerH = link.html(); // "<b>example</b>"
如果需要构成该文本的部分,则可以遍历该元素的子节点,并仅选择属于TextNode实例的部分:

Element p = doc.select("p").first();
System.out.println(p.ownText());

要获取段落的文本,请选择该段落并要求提供其自己的文本:

String html = "<p>An <a href='http://example.com/'><b>example</b></a> link.</p>";
Document doc = Jsoup.parse(html);
Element link = doc.select("a").first();

String text = doc.body().text(); // "An example link"
String linkHref = link.attr("href"); // "http://example.com/"
String linkText = link.text(); // "example""

String linkOuterH = link.outerHtml(); 
    // "<a href="http://example.com"><b>example</b></a>"
String linkInnerH = link.html(); // "<b>example</b>"
如果需要构成该文本的部分,则可以遍历该元素的子节点,并仅选择属于TextNode实例的部分:

Element p = doc.select("p").first();
System.out.println(p.ownText());