Python 从FeedParser中删除URL和图像

Python 从FeedParser中删除URL和图像,python,open-source,feed,google-code,Python,Open Source,Feed,Google Code,我正在用它来写一个简单的新闻集成商 但是我想要纯文本(带有标记),但不需要URL或图像(即没有 只需删除a&img标记即可 二, 使用feedparser时,首先删除两个标记 哪种方法更好 还有其他好方法吗 非常感谢!通常,越快越好,这可以使用python来确定。但是在您的情况下,我不希望更改源代码,而是坚持使用第二个选项。这有助于可维护性 其他选项包括编写自定义解析器(使用C扩展以获得最高速度)或让站点的模板引擎(可能是Django?)去掉这些标记。好吧,我改变主意了,最后一个解决方案似乎是最

我正在用它来写一个简单的新闻集成商

但是我想要纯文本(带有
标记),但不需要URL或图像(即没有

只需删除a&img标记即可

二,

使用feedparser时,首先删除两个标记

哪种方法更好

还有其他好方法吗


非常感谢!

通常,越快越好,这可以使用python来确定。但是在您的情况下,我不希望更改源代码,而是坚持使用第二个选项。这有助于可维护性

其他选项包括编写自定义解析器(使用C扩展以获得最高速度)或让站点的模板引擎(可能是Django?)去掉这些标记。好吧,我改变主意了,最后一个解决方案似乎是最好的全面解决方案

class _HTMLSanitizer(_BaseHTMLProcessor):
    acceptable_elements =[....]
import feedparser 
feedparser._HTMLSanitizer.acceptable_elements = feedparser._HTMLSanitizer.acceptable_elements.remove('a')
feedparser._HTMLSanitizer.acceptable_elements = feedparser._HTMLSanitizer.acceptable_elements.remove('img')