Python 有没有一种方法可以用标准的方法阅读来自不同新闻来源的徽标图像？_Python_Rss_Html Parsing_Beautifulsoup

Python 有没有一种方法可以用标准的方法阅读来自不同新闻来源的徽标图像？

python rss

Python 有没有一种方法可以用标准的方法阅读来自不同新闻来源的徽标图像？,python,rss,html-parsing,beautifulsoup,Python,Rss,Html Parsing,Beautifulsoup,我目前正在开发一个新闻再版网站，它可以从rss提要中阅读新闻。问题是，当我试图从不同的新闻机构获取每个网站上不同的新闻徽标图像时。目前，我正在为200个站点使用大约200个IF命令。这是我使用python编写的代码： try: img = soup.body.find('div', {'class': 'image-wrap'}).img.attrs['src'] Image.open(cStringIO.StringIO(urllib2.urlopen(str(img)).r

我目前正在开发一个新闻再版网站，它可以从rss提要中阅读新闻。问题是，当我试图从不同的新闻机构获取每个网站上不同的新闻徽标图像时。目前，我正在为200个站点使用大约200个IF命令。
这是我使用python编写的代码：

try:
    img = soup.body.find('div', {'class': 'image-wrap'}).img.attrs['src']
    Image.open(cStringIO.StringIO(urllib2.urlopen(str(img)).read()))
except:
    try:
        img = soup.body.find('div', {'id': 'post-body'}).a.attrs['href']
        Image.open(cStringIO.StringIO(urllib2.urlopen(str(img)).read()))
    except:
        try:
            img = soup.body.find('div', {'class': 'image'}).img.attrs['src']
        except:
            img = soup.head.find('meta', {'property': 'og:image'}).attrs['content']
            if "breakingnews5.jpg" in img:
                img = ""

是否可以将每个网站的信息存储在数据库中，并使用这些信息提取图像？

如果您使用的是大约200个服务的固定列表，我建议您创建一个字典或图像，使用如此独立的代码，让您手动查看提要并选择作为徽标的图像，然后使用固定的命名约定。

字典的格式如何？每个通讯社的形式都不同。我该怎么办？与其说是一个巨大的if语句，不如说是给出每个提要如何格式化其徽标的指纹并将指纹存储在python字典中，或者不尝试显示提要中的徽标，而是为每个提要创建自己捕获的徽标。