Java 确定网站集合是否有RSS源

Java 确定网站集合是否有RSS源,java,python,rss,Java,Python,Rss,我有以下问题: 我有一个主机集合,我需要确定它们是否有rss提要? 最大的问题是我拥有的集合非常庞大,所以我无法手动浏览它们,我需要用Java或python编写一个工具来浏览它们并确定它们是否有rss提要 我确实需要这样做,但这听起来确实非常难以实现,特别是在如此大的数据收集中 如果有人知道我该怎么做,或者我可以在哪里找到相关信息,欢迎在下面发表评论 谢谢。您可以获取页面的源代码,并验证“head”中的link元素是否具有以下格式:rel=“alternate”type=“application

我有以下问题:

我有一个主机集合,我需要确定它们是否有rss提要? 最大的问题是我拥有的集合非常庞大,所以我无法手动浏览它们,我需要用Java或python编写一个工具来浏览它们并确定它们是否有rss提要

我确实需要这样做,但这听起来确实非常难以实现,特别是在如此大的数据收集中

如果有人知道我该怎么做,或者我可以在哪里找到相关信息,欢迎在下面发表评论


谢谢。

您可以获取页面的源代码,并验证“head”中的link元素是否具有以下格式:rel=“alternate”type=“application/rss+xml”


您尝试过什么?你有什么问题?你是在问如何写循环吗?如何发送HTTP请求?如何解析HTML?什么标签指向RSS提要?
<head>
  <link rel="alternate" type="application/rss+xml" title="RSS 2.0" href="http://url_to_test" />
</head>