Python中的RSS提要解析器库

Python中的RSS提要解析器库,python,rss,feedparser,Python,Rss,Feedparser,我正在寻找一个好的python库,它将帮助我解析RSS提要。有人用过feedparser吗?有什么反馈吗? 第一次点击G.回答您的后续问题。您可以使用BeautifulSoup,但feedparser更适合RSS处理 不是说snark,但是你读过FeedParser吗?我不知道怎么用起来更简单 如果需要其他选择,请尝试xml.dom.minidom。 就像“Django是Python”,“RSS是XML”。Feedparser功能强大、可配置且易于使用。非常友好的学习曲线,如果有的话。 示例 通

我正在寻找一个好的python库,它将帮助我解析RSS提要。有人用过feedparser吗?有什么反馈吗?


第一次点击G.

回答您的后续问题。您可以使用BeautifulSoup,但feedparser更适合RSS处理


不是说snark,但是你读过FeedParser吗?我不知道怎么用起来更简单

如果需要其他选择,请尝试xml.dom.minidom。
就像“Django是Python”,“RSS是XML”。

Feedparser功能强大、可配置且易于使用。非常友好的学习曲线,如果有的话。

示例

通过编程确定您的问题有多少答案:

easy_install feedparser
python -c 'import feedparser; print len(feedparser.parse("http://bit.ly/c785aj")["entries"])'
与使用minidom或BeautifulSoup滚动相比,使用是一个更好的选择

  • 它规范化了RSS和Atom的所有版本之间的差异,因此您不必为每种类型使用不同的代码
  • 它很适合检测提要中的不同日期格式和其他变化
  • 它会自动跟随HTTP重定向
  • 它清理HTML内容
  • 它支持ETag和Last Modified标头,因此您可以通过下载HTTP标头而不是整个提要来查看提要是否已更改
  • 它支持经过身份验证的提要
  • 它支持HTTP代理
就像其他人提到的,试试看。解析一个提要需要两行代码。我唯一的抱怨是,它只是使用字典作为数据模型,如果提要中没有某些属性,那么字典中可能会缺少这些属性,因此您必须在代码中检查这些属性。但是文档非常清楚哪些属性总是在字典中,哪些属性可能会丢失


最后,我可以为它担保,因为我已经编写了一个使用它的应用程序。请参见此处:

我强烈推荐feedparser。

我知道这是一个非常古老的主题,但出于性能原因,我使用的是feedparser(通用feed parser)版本5.1.3,最近我切换到了(0.1.8)。它的接口几乎相同,但运行速度更快


我在业余应用程序中使用它,speedparser在我的提要上运行速度快了大约5倍。

到2019年,它可能是
feedparser的替代品,尽管我还没有使用过它。

好吧,他在问题中提到过它……不管怎样,除了feedpurser之外,你们还有什么好用的吗?@rahman.bd不,feedparser太好了,没有人会在意替代品。feedparser是一个很棒的库。它有大量的单元测试,并带有一个极好的内置库,可以帮助进行字符编码检测。这确实是一件艺术作品。下载和试用feedparser需要5分钟。下载和试用feedparser可能只需要5分钟,但要充分使用它,形成一个我们和其他人一样有用和可靠的观点,需要更长的时间。5分钟的使用只会证明它可以安装并处理主要用例。当feedparser存在时,没有充分的理由采取这种方法。您必须处理RSS和Atom之间的差异、格式错误的提要、各种日期/时间戳格式等。您可以使用.entries而不是[“entries”],因为feedparser使用允许属性访问的自定义词典。更容易输入和阅读。谢谢你的例子@谢谢你的解释,谢谢你的回答!。。是的,它是如此酷和定义良好的文档!。。易于使用。!!不过,您的提要通知程序也很有趣!你知道有一个库可以接收feedparser的输出并将其转换回feed吗?目前有一个问题困扰着我:feedparser在Flickr feed中的“媒体:”元素上出现故障。真烦人。我刚刚提出了一个问题,希望我能尽快解决。谢谢你的文章。。。我能得到feednotifier的源代码吗?为了其他人的利益:feedparser.org已经被MarkPilgrim删除了。我将在下一版本中提供它。