Java使用JSOUP从HTML源代码获取RSS链接

Java使用JSOUP从HTML源代码获取RSS链接,java,rss,jsoup,html-parser,Java,Rss,Jsoup,Html Parser,我正在尝试从html源代码获取RSS链接。我使用java库查找rss链接。我写了一小段代码来获取RSS链接,但不幸的是,它并不适用于所有网站。下面是我的代码 String url = "http://www.smashingmagazine.com/"; // not working Document doc = Jsoup.connect(url).get(); Elements links = doc.select("link[type=application/rss+xml]"); if

我正在尝试从html源代码获取RSS链接。我使用java库查找rss链接。我写了一小段代码来获取RSS链接,但不幸的是,它并不适用于所有网站。下面是我的代码

String url = "http://www.smashingmagazine.com/"; // not working
Document doc = Jsoup.connect(url).get();
Elements links = doc.select("link[type=application/rss+xml]");

if (links.size() > 0) {
    String rss_url = links.get(0).attr("href").toString();
} else {
    // RSS url not found
}
以上代码并不适用于所有网站。请解决我的问题。 (我正在尝试查找RSS 2.0链接)

谢谢

答案是:

String url = "http://www.smashingmagazine.com/"; // not working
Document doc = Jsoup.connect(url).get();

Elements links = doc.select("link[type=application/rss+xml]");

if (links.size() > 0) {
    String rss_url = links.get(0).attr("abs:href").toString();
} else {....
    // RSS url not found
}
我希望你一切都好。 它与.attr(*“abs:*href”)一起使用


Ertu

为什么不使用基于java的
RSS解析器(如Rome
)来解析它呢。任何提供RSS提要的站点都可以重复上述过程。不,url不是静态的。用户可以提供任何网站url,我需要找到rss url并对其进行解析。如果您观察您的网页,它没有
application/rss+xml
,而是
application/atom+xml
谢谢RanRag。但是在这个url中,如果你看到那里的源代码
application/rss+xml
,我仍然没有得到rss url。你确定这个站点是
dtscinema.com
b'coz吗?当我试图从这里打开它时,它似乎域已经过期了。