Rss 如何查找特定新闻源的提要或XML

Rss 如何查找特定新闻源的提要或XML,rss,html-content-extraction,Rss,Html Content Extraction,我想获得一个特定新闻源的xml文件,如果有任何项目将html新闻转换为xml,解析页面并在单个xml或类似类型的文件中标记其各种特征,如日期、作者姓名、标题、内容等。 例如,请参见此链接: 如何从该网页中提取内容、作者、日期等。或者,如果我能找到这个网页的提要,我可以很容易地做到这一点。但是我怎样才能找到它。你在使用哪种技术 如果它是一个纯粹的客户端/web解决方案,那么您可以找到js选项。如果您在服务器端,您可以查看页面是否有提要,扫描HTML以查找具有以下属性的特定标记: <link

我想获得一个特定新闻源的xml文件,如果有任何项目将html新闻转换为xml,解析页面并在单个xml或类似类型的文件中标记其各种特征,如日期、作者姓名、标题、内容等。 例如,请参见此链接:
如何从该网页中提取内容、作者、日期等。或者,如果我能找到这个网页的提要,我可以很容易地做到这一点。但是我怎样才能找到它。

你在使用哪种技术


如果它是一个纯粹的客户端/web解决方案,那么您可以找到js选项。如果您在服务器端,您可以

查看页面是否有提要,扫描HTML以查找具有以下属性的特定标记:

<link rel="alternate" type="application/rss+xml" title="Page as RSS"
 href="http://example.com/page/feed">

提要URL存储在href属性中。这种机制被称为