Python Beautifulsoup:如果标记或元素未知,如何查找字符串?

Python Beautifulsoup:如果标记或元素未知,如何查找字符串?,python,html,web-scraping,html-parsing,beautifulsoup,Python,Html,Web Scraping,Html Parsing,Beautifulsoup,正如它所说的那样。是否仍然可以在整个DOM中搜索特定文本,例如验证码word?您可以使用查找并指定参数: 使用文本,您可以搜索字符串而不是标记。如姓名和 关键字参数,你可以传入一个字符串,一个正则表达式, 列表、函数或值True 或者,如果将正则表达式传递到文本中,也可以实现同样的效果: >>> import re >>> soup.find(text=re.compile('CAPTCHA')).parent <div class="myclass2"

正如它所说的那样。是否仍然可以在整个DOM中搜索特定文本,例如验证码word?

您可以使用
查找
并指定参数:

使用文本,您可以搜索字符串而不是标记。如姓名和 关键字参数,你可以传入一个字符串,一个正则表达式, 列表、函数或值True

或者,如果将正则表达式传递到
文本中,也可以实现同样的效果:

>>> import re
>>> soup.find(text=re.compile('CAPTCHA')).parent
<div class="myclass2">Here CAPTCHA is a part of a sentence</div>
>>重新导入
>>>soup.find(text=re.compile('CAPTCHA')).parent
这里验证码是句子的一部分

您可以使用
查找
并指定参数:

使用文本,您可以搜索字符串而不是标记。如姓名和 关键字参数,你可以传入一个字符串,一个正则表达式, 列表、函数或值True

或者,如果将正则表达式传递到
文本中,也可以实现同样的效果:

>>> import re
>>> soup.find(text=re.compile('CAPTCHA')).parent
<div class="myclass2">Here CAPTCHA is a part of a sentence</div>
>>重新导入
>>>soup.find(text=re.compile('CAPTCHA')).parent
这里验证码是句子的一部分

您有一致的值吗?类、id、结构?不,我根本不知道标记/元素。只有当字符串有特定的设计时,您才可以使用正则表达式来解析它,尽管它可能不太可靠。或者,您可以与任何可以返回真/假的函数进行匹配。您有任何一致的值吗?类、id、结构?不,我根本不知道标记/元素。只有当字符串有特定的设计时,您才可以使用正则表达式来解析它,尽管它可能不太可靠。另请参见,您可以匹配任何可以返回true/false的函数。
>>> import re
>>> soup.find(text=re.compile('CAPTCHA')).parent
<div class="myclass2">Here CAPTCHA is a part of a sentence</div>