Python 美素素素：提取；alt"；或；标题「；gif文件中的字段_Python_Html_Beautifulsoup_Python Requests

Python 美素素素：提取；alt"；或；标题「；gif文件中的字段

python html

Python 美素素素：提取；alt"；或；标题「；gif文件中的字段,python,html,beautifulsoup,python-requests,Python,Html,Beautifulsoup,Python Requests,下面的代码用于从包含一个名为error.gif的小gif的页面检索URL。但是，我想进一步扩展scrape，但在提取与error.gif相关的数据时遇到了问题。在鼠标上，gif将显示一条小消息，我也想获得此弹出消息，但我的尝试未能返回任何值。我查过BS的网站，也看过其他教程，但我在其他地方都没有发现或阅读过这方面的内容本质上，我试图提取“alt”字段或“title”字段，并将其附加到已提取的超链接的右侧工作代码导入请求从bs4导入BeautifulSoup soup=Beautiful

下面的代码用于从包含一个名为error.gif的小gif的页面检索URL。但是，我想进一步扩展scrape，但在提取与error.gif相关的数据时遇到了问题。在鼠标上，gif将显示一条小消息，我也想获得此弹出消息，但我的尝试未能返回任何值。我查过BS的网站，也看过其他教程，但我在其他地方都没有发现或阅读过这方面的内容

本质上，我试图提取“alt”字段或“title”字段，并将其附加到已提取的超链接的右侧

工作代码

导入请求
从bs4导入BeautifulSoup
soup=BeautifulSoup（requests.get（“http:/”）.content，“html.parser”）
tables=soup.find（'table'，class='serverTable'）
行=表。查找所有（'tr'）
对于行中的tr：
cols=tr.find_all（'td'））
linkstr=str（cols）
如果linkstr中的“error.gif”：
如果linkstr中没有“good.gif”：
如果linkstr中没有“=>”：
对于tr中的链接（'a'，href=True）：
打印（“错误=>”，链接）

请添加该页面的链接。请包含您试图解析的HTML的最小示例。顺便说一句，与其使用

linkstr

，不如使用

find

或

find\u all

提取

img

对象，然后使用BS APIJanus获取其

title

和

alt

属性，我拍摄了我遇到问题的代码快照，我不能提供一个直接的链接，因为这个页面是内部托管的，不是面向公众的。虽然代码并不完美，但我能够提取我想要的数据。此脚本的最终目标是在页面上搜索error.gif，将结果粘贴到电子邮件模板中，并每隔一小时左右通过电子邮件发送一次结果。感谢您和Rahul花时间帮助我。Rahul，我无法提供链接，该页面是内部托管的。但是，您的代码建议帮助我提取了我遇到问题的“title”字段的内容。我认为你的答案是正确的。谢谢你抽出时间来帮助我。

import requests 
from bs4 import BeautifulSoup 

soup = BeautifulSoup(requests.get("http://<site>").content, "html.parser") 
tables = soup.find('table', class_='serverTable') 
rows = tables.find_all('tr')   

for tr in rows:
    cols = tr.find_all('td')
    linkstr = str(cols)
    if 'error.gif' in linkstr:
        if not 'good.gif' in linkstr:
            if not '=&gt' in linkstr:
                for link in tr('a', href=True):

                    print("ERROR =>", link)

errors = soup.find_all('img', {'src':'img/error.gif'})

for tag in errors:
   print(tag['title']) # or any attribute you want to extract from that tag.