Python 漂亮的汤蟒蛇点击标签_Python_Beautifulsoup

Python 漂亮的汤蟒蛇点击标签

python

Python 漂亮的汤蟒蛇点击标签,python,beautifulsoup,Python,Beautifulsoup,记住beautiful soup不是一个web浏览器，而是一个解析器：因此“单击”的动作并不完全相同：它不像web浏览器那样执行Javascript模型这就是说，如果你制作了一个原始的蜘蛛机器人（确保如果你这样做了，你可以查看你的目标站点robots.txt文件），就可以“跟踪”链接假设您有这样的代码来获取对“a”标记的引用 'SyntaxError: keyword can't be an expression' 然后，您现在可以查看该标记的属性：注意，如果mytag中的“数据iso代

记住beautiful soup不是一个web浏览器，而是一个解析器：因此“单击”的动作并不完全相同：它不像web浏览器那样执行Javascript模型

这就是说，如果你制作了一个原始的蜘蛛机器人（确保如果你这样做了，你可以查看你的目标站点

robots.txt

文件），就可以“跟踪”链接

假设您有这样的代码来获取对“a”标记的引用

'SyntaxError: keyword can't be an expression'

然后，您现在可以查看该标记的属性：

注意，如果mytag中的“数据iso代码”，则不能执行

：但可以执行以下操作：
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc, 'html.parser')
mytag = soup.a # or use soup.findall('a') etc and loop over the results

（代码在这里编写，没有测试，所以要注意拼写错误）Beauty Soup是一个用于解析HTML/XML的Python包。是的，我知道我在解析一个网站时遇到了这个问题……有很多“a”标记，所以为了区分，我必须检查数据iso代码，但它不起作用
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc, 'html.parser')
mytag = soup.a # or use soup.findall('a') etc and loop over the results

def has_correct_attr(tag, attr, val):
    has_attr = False
    try:
        if mytag[attr] == val:
            has_attr = True
        else:
            has_attr = False
    except KeyError:
        has_attr = False
    return has_attr

has_correct_attr(mytag, "data-iso-code", "inr")