Python 美素素素:提取;alt";或;标题「;gif文件中的字段

Python 美素素素:提取;alt";或;标题「;gif文件中的字段,python,html,beautifulsoup,python-requests,Python,Html,Beautifulsoup,Python Requests,下面的代码用于从包含一个名为error.gif的小gif的页面检索URL。但是,我想进一步扩展scrape,但在提取与error.gif相关的数据时遇到了问题。 在鼠标上,gif将显示一条小消息,我也想获得此弹出消息,但我的尝试未能返回任何值。我查过BS的网站,也看过其他教程,但我在其他地方都没有发现或阅读过这方面的内容 本质上,我试图提取“alt”字段或“title”字段,并将其附加到已提取的超链接的右侧 工作代码 导入请求 从bs4导入BeautifulSoup soup=Beautiful

下面的代码用于从包含一个名为error.gif的小gif的页面检索URL。但是,我想进一步扩展scrape,但在提取与error.gif相关的数据时遇到了问题。 在鼠标上,gif将显示一条小消息,我也想获得此弹出消息,但我的尝试未能返回任何值。我查过BS的网站,也看过其他教程,但我在其他地方都没有发现或阅读过这方面的内容

本质上,我试图提取“alt”字段或“title”字段,并将其附加到已提取的超链接的右侧

工作代码
导入请求
从bs4导入BeautifulSoup
soup=BeautifulSoup(requests.get(“http:/”).content,“html.parser”)
tables=soup.find('table',class='serverTable')
行=表。查找所有('tr')
对于行中的tr:
cols=tr.find_all('td'))
linkstr=str(cols)
如果linkstr中的“error.gif”:
如果linkstr中没有“good.gif”:
如果linkstr中没有“=>”:
对于tr中的链接('a',href=True):
打印(“错误=>”,链接)

请添加该页面的链接。请包含您试图解析的HTML的最小示例。顺便说一句,与其使用
linkstr
,不如使用
find
find\u all
提取
img
对象,然后使用BS APIJanus获取其
title
alt
属性,我拍摄了我遇到问题的代码快照,我不能提供一个直接的链接,因为这个页面是内部托管的,不是面向公众的。虽然代码并不完美,但我能够提取我想要的数据。此脚本的最终目标是在页面上搜索error.gif,将结果粘贴到电子邮件模板中,并每隔一小时左右通过电子邮件发送一次结果。感谢您和Rahul花时间帮助我。Rahul,我无法提供链接,该页面是内部托管的。但是,您的代码建议帮助我提取了我遇到问题的“title”字段的内容。我认为你的答案是正确的。谢谢你抽出时间来帮助我。
import requests 
from bs4 import BeautifulSoup 

soup = BeautifulSoup(requests.get("http://<site>").content, "html.parser") 
tables = soup.find('table', class_='serverTable') 
rows = tables.find_all('tr')   

for tr in rows:
    cols = tr.find_all('td')
    linkstr = str(cols)
    if 'error.gif' in linkstr:
        if not 'good.gif' in linkstr:
            if not '=&gt' in linkstr:
                for link in tr('a', href=True):

                    print("ERROR =>", link)
errors = soup.find_all('img', {'src':'img/error.gif'})

for tag in errors:
   print(tag['title']) # or any attribute you want to extract from that tag.