如何查找特定网站的RSS源?

如何查找特定网站的RSS源?,rss,Rss,如何查找特定网站的RSS源?是否有任何特定的方法可以找到它?您可以通过查看主页(或博客)的来源来找到它。查找一行如下所示: <link rel="alternate" type="application/rss+xml" title="RSS Feed" href="http://example.org/rss" /> href值将是RSS所在的位置。有多种方法可以获取网站的RSS提要 您可以做的是获取网站的页面源代码并搜索type=“application/rss+xml”

如何查找特定网站的RSS源?是否有任何特定的方法可以找到它?

您可以通过查看主页(或博客)的来源来找到它。查找一行如下所示:

<link rel="alternate" type="application/rss+xml" title="RSS Feed" href="http://example.org/rss" />


href值将是RSS所在的位置。

有多种方法可以获取网站的RSS提要

您可以做的是获取网站的页面源代码并搜索
type=“application/rss+xml”

这将包含该网站的RSS提要(如果有的话)

这里有一个简单的python程序,可以打印任何网站的RSS提要(如果有的话)

导入请求
从bs4导入BeautifulSoup
def get_rss_提要(网站url):
如果网站url为“无”:
打印(“URL不应为空”)
其他:
source\u code=requests.get(网站\u url)
纯文本=源代码.text
soup=BeautifulSoup(纯文本)
对于soup.find_all中的链接(“link”,{“type”:“application/rss+xml”}):
href=link.get('href')
打印(“用于“+website_url+”的RSS提要是-->”+str(href))
获取rss订阅源(“http://www.extremetech.com/")
使用.py扩展名保存此文件并运行它。它将为您提供该网站的rss提要url

谷歌还提供API来查找网站的RSS提要。
请在这里找到它们:

我需要找到带有RSS提要的站点。使用VisualStudio(VB)我可以做到这一点。下面的代码只是一个片段。循环结束后,它将消失,但它确实在站点上找到了对rss页面的任何引用。这就是我所需要的,所以我从来没有完成过。但这对我很管用

导入系统.Net 导入System.IO

。。。 Dim请求作为WebRequest request=WebRequest.Create(“”)


..

您需要循环浏览网站上的所有URL,然后找到一个包含“rss”的URL

如果href标记中的url看起来像feed.xml,则上述方法在某些情况下可能不起作用,因此在这种情况下,您需要遍历包含hrefrss的所有标记,然后从href属性解析url


若要通过浏览器执行此操作,请按CTRL+U以查看源代码,然后按CTRL+F以打开“查找”窗口,然后只需键入rss即可。RSS提要url应该立即出现。

Firefox的工具菜单现在有一个“页面信息”命令。该工具中的一个选项卡显示发现的订阅源信息。

这是一个标准的权限,因此我可以在每个网站上查找此权限?尽管标题属性的值可能会更改。是否有类似的方法查找atom订阅源?@Cort3z,当然可以!在那里的某个地方可能有类似的东西:
。关键是寻找
application/atom+xml
@FrancoisDeschenes-Nice。但它看起来确实有点脆弱。并不是每个人都会在其中添加类型。也许最好的选择是搜索包含关键字提要、rss或atom的链接。另外,需要注意的是,某些网站可能根本没有提要。在这种情况下,您将无法找到上面提到的任何RSS源代码。我的意思是“不是所有的网站/博客都有RSS提要”。谷歌的API现在已经被弃用了。不再是Firefox 64插件来拯救:
    Dim response As WebResponse = request.GetResponse()
    Dim responseStream As Stream = response.GetResponseStream()
    Dim reader As New StreamReader(responseStream)

    Dim line As String = reader.ReadLine()
    Dim intPos As Integer

    Do
        line = reader.ReadLine()
        intPos = line.IndexOf("/rss")
        If intPos > 0 Then
            MessageBox.Show(line + " " + intPos.ToString)
        End If
    Loop While Not line Is Nothing