Java 如何使用Jsoup解析内部和外部超链接

Java 如何使用Jsoup解析内部和外部超链接,java,hyperlink,jsoup,Java,Hyperlink,Jsoup,我正在练习网络抓取,我想知道我怎么能只抓取内部和外部超链接。我能够按照Jsoup文档检索页面的所有链接,但我仍然不知道如何做到这一点 提前感谢您的帮助您可以尝试Document.getElementsByAttributeValueMatching()方法,通过属性名和具有适当正则表达式的属性值查找元素 例如,查找属性名为“href”且属性值以开头的所有元素 还有一些类似的方法: Document.getElementsByAttributeValueStarting() Document.ge

我正在练习网络抓取,我想知道我怎么能只抓取内部和外部超链接。我能够按照Jsoup文档检索页面的所有链接,但我仍然不知道如何做到这一点


提前感谢您的帮助

您可以尝试Document.getElementsByAttributeValueMatching()方法,通过属性名和具有适当正则表达式的属性值查找元素

例如,查找属性名为“href”且属性值以开头的所有元素

还有一些类似的方法:

Document.getElementsByAttributeValueStarting()
Document.getElementsByAttributeValueContaining()

结果列表与站点的基本url之间的简单字符串匹配?如果您需要内部和外部链接,该列表是否不包括所有链接?如果您已经按照JSoup文档获取了所有链接。。。听起来你的工作完成了@2020-09年我的目标是单独检索它们。我仍然不知道你在说什么,尽管现在你有了一个你喜欢的答案。。。祝你的软件好运。
Document.getElementsByAttributeValueStarting()
Document.getElementsByAttributeValueContaining()