Java使用JSOUP从HTML源代码获取RSS链接
我正在尝试从html源代码获取RSS链接。我使用java库查找rss链接。我写了一小段代码来获取RSS链接,但不幸的是,它并不适用于所有网站。下面是我的代码Java使用JSOUP从HTML源代码获取RSS链接,java,rss,jsoup,html-parser,Java,Rss,Jsoup,Html Parser,我正在尝试从html源代码获取RSS链接。我使用java库查找rss链接。我写了一小段代码来获取RSS链接,但不幸的是,它并不适用于所有网站。下面是我的代码 String url = "http://www.smashingmagazine.com/"; // not working Document doc = Jsoup.connect(url).get(); Elements links = doc.select("link[type=application/rss+xml]"); if
String url = "http://www.smashingmagazine.com/"; // not working
Document doc = Jsoup.connect(url).get();
Elements links = doc.select("link[type=application/rss+xml]");
if (links.size() > 0) {
String rss_url = links.get(0).attr("href").toString();
} else {
// RSS url not found
}
以上代码并不适用于所有网站。请解决我的问题。
(我正在尝试查找RSS 2.0链接)
谢谢答案是:
String url = "http://www.smashingmagazine.com/"; // not working
Document doc = Jsoup.connect(url).get();
Elements links = doc.select("link[type=application/rss+xml]");
if (links.size() > 0) {
String rss_url = links.get(0).attr("abs:href").toString();
} else {....
// RSS url not found
}
我希望你一切都好。
它与.attr(*“abs:*href”)一起使用
Ertu为什么不使用基于java的
RSS解析器(如Rome
)来解析它呢。任何提供RSS提要的站点都可以重复上述过程。不,url不是静态的。用户可以提供任何网站url,我需要找到rss url并对其进行解析。如果您观察您的网页,它没有application/rss+xml
,而是application/atom+xml
谢谢RanRag。但是在这个url中,如果你看到那里的源代码application/rss+xml
,我仍然没有得到rss url。你确定这个站点是dtscinema.com
b'coz吗?当我试图从这里打开它时,它似乎域已经过期了。