Java 如何使用Jsoup从链接标记中检索URL ]
如何从这个HTML文档中检索URL并使用Jsoup链接文本? 我希望它看起来像这样 “链接文本[URL]” 编辑:我只想检索其中的链接Java 如何使用Jsoup从链接标记中检索URL ] ,java,jsoup,Java,Jsoup,如何从这个HTML文档中检索URL并使用Jsoup链接文本? 我希望它看起来像这样 “链接文本[URL]” 编辑:我只想检索其中的链接 <article itemprop="articleBody"> <p channel="wp.com" class="interstitial-link"> <i> [<a href="www.URL.com" shape="rect">Link Text</a>]
<article itemprop="articleBody">
<p channel="wp.com" class="interstitial-link">
<i>
[<a href="www.URL.com" shape="rect">Link Text</a>]
</i>
</p>
<article>
。。。
不是整个页面。此外,我希望所有的链接内,而不仅仅是一个
<article itemprop="articleBody"> ... <article>
阅读更多关于
您还可以像这样迭代文章中的每个链接:
// connect to URL and retrieve source code as document
Document doc = Jsoup.connect(url).get();
// find the link element in the article
Element link = doc
.select("article[itemprop=articleBody] p.interstitial-link i a")
.first();
// extract the link text
String linkText = link.ownText();
// extract the full url of the href
// use this over link.attr("href") to avoid relative url
String linkURL = link.absUrl("href");
// display
System.out.println(
String.format(
"%s[%s]",
linkText,
linkURL));
输出
for (Element link : doc.select("article[itemprop=articleBody] a")) {
String linkText = link.ownText();
String linkURL = link.absUrl("href");
System.out.println(
String.format(
"%s[%s]",
linkText,
linkURL));
}
你试过使用选择器吗?是的,这就是我遇到的问题。特别是CSS选择器。你能发布你的尝试吗?我们中的大多数人访问Stack Overflow是为了帮助他人更正代码,而不是从头开始为他们编写代码。因此,通过发布,您可以增加获得关于您在创建解决方案时遇到的问题的合理答案和解释的机会。好的,谢谢,我是新手,正在尝试更好地发布问题。下次我会考虑你的建议。如果是这样的话,你应该访问我们的。不知道为什么你的第一个解决方案会出现空指针错误。但是,您的第二个解决方案非常有效。非常感谢你。
Link Text[http://www.URL.com]