Java 确定网站集合是否有RSS源
我有以下问题: 我有一个主机集合,我需要确定它们是否有rss提要? 最大的问题是我拥有的集合非常庞大,所以我无法手动浏览它们,我需要用Java或python编写一个工具来浏览它们并确定它们是否有rss提要 我确实需要这样做,但这听起来确实非常难以实现,特别是在如此大的数据收集中 如果有人知道我该怎么做,或者我可以在哪里找到相关信息,欢迎在下面发表评论Java 确定网站集合是否有RSS源,java,python,rss,Java,Python,Rss,我有以下问题: 我有一个主机集合,我需要确定它们是否有rss提要? 最大的问题是我拥有的集合非常庞大,所以我无法手动浏览它们,我需要用Java或python编写一个工具来浏览它们并确定它们是否有rss提要 我确实需要这样做,但这听起来确实非常难以实现,特别是在如此大的数据收集中 如果有人知道我该怎么做,或者我可以在哪里找到相关信息,欢迎在下面发表评论 谢谢。您可以获取页面的源代码,并验证“head”中的link元素是否具有以下格式:rel=“alternate”type=“application
谢谢。您可以获取页面的源代码,并验证“head”中的link元素是否具有以下格式:rel=“alternate”type=“application/rss+xml”
您尝试过什么?你有什么问题?你是在问如何写循环吗?如何发送HTTP请求?如何解析HTML?什么标签指向RSS提要?
<head>
<link rel="alternate" type="application/rss+xml" title="RSS 2.0" href="http://url_to_test" />
</head>