Python 漂亮的汤蟒蛇点击标签
记住beautiful soup不是一个web浏览器,而是一个解析器:因此“单击”的动作并不完全相同:它不像web浏览器那样执行Javascript模型 这就是说,如果你制作了一个原始的蜘蛛机器人(确保如果你这样做了,你可以查看你的目标站点Python 漂亮的汤蟒蛇点击标签,python,beautifulsoup,Python,Beautifulsoup,记住beautiful soup不是一个web浏览器,而是一个解析器:因此“单击”的动作并不完全相同:它不像web浏览器那样执行Javascript模型 这就是说,如果你制作了一个原始的蜘蛛机器人(确保如果你这样做了,你可以查看你的目标站点robots.txt文件),就可以“跟踪”链接 假设您有这样的代码来获取对“a”标记的引用 'SyntaxError: keyword can't be an expression' 然后,您现在可以查看该标记的属性: 注意,如果mytag中的“数据iso代
robots.txt
文件),就可以“跟踪”链接
假设您有这样的代码来获取对“a”标记的引用
'SyntaxError: keyword can't be an expression'
然后,您现在可以查看该标记的属性:
注意,如果mytag中的“数据iso代码”,则不能执行:但可以执行以下操作:
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc, 'html.parser')
mytag = soup.a # or use soup.findall('a') etc and loop over the results
(代码在这里编写,没有测试,所以要注意拼写错误)Beauty Soup是一个用于解析HTML/XML的Python包。是的,我知道我在解析一个网站时遇到了这个问题……有很多“a”标记,所以为了区分,我必须检查数据iso代码,但它不起作用
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc, 'html.parser')
mytag = soup.a # or use soup.findall('a') etc and loop over the results
def has_correct_attr(tag, attr, val):
has_attr = False
try:
if mytag[attr] == val:
has_attr = True
else:
has_attr = False
except KeyError:
has_attr = False
return has_attr
has_correct_attr(mytag, "data-iso-code", "inr")