Python 如何使用应用于BeautifulSoup中的正则表达式从_Python_Regex_Web Scraping_Beautifulsoup

Python 如何使用应用于BeautifulSoup中的正则表达式从

python regex web-scraping

Python 如何使用应用于BeautifulSoup中的正则表达式从,python,regex,web-scraping,beautifulsoup,Python,Regex,Web Scraping,Beautifulsoup,标记获取文本？我已经用python编写了一些脚本，使用正则表达式从某些p标记中获取文本，但这个脚本给了我一个空列表这是html元素的磁性部分：目的是使用regex获取上述标记的文本这就是我迄今为止所尝试的： winner = soup.find_all('p',class_="result__outcome u-hide-phablet") win_list = re.findall(r'>(.*?)</p>', str(winner)) 上面的部分生成空列表。在

标记获取文本？我已经用python编写了一些脚本，使用正则表达式从某些p标记中获取文本，但这个脚本给了我一个空列表

这是html元素的磁性部分：

目的是使用regex获取上述标记的文本

这就是我迄今为止所尝试的：

winner = soup.find_all('p',class_="result__outcome u-hide-phablet") 
win_list = re.findall(r'>(.*?)</p>', str(winner))

上面的部分生成空列表。在此方面的任何帮助都将不胜感激

Post script：我正在寻找任何与regex相关的解决方案。

要访问您感兴趣的标记，您可以执行以下操作：

for p in soup.findAll("p", {"class" : "result__outcome u-hide-phablet"}):
    tags_text = p.text

对于span，您需要以相同的方式执行以下操作：

for span in soup.findAll("span", {"class" : "result__score result__score--winner"}):
        tags_text = span.text

这是为了获得每个标记中的文本，正如您在问题中所问的。

您在所提到的htmlI更正结果中没有类结果\uuu info u-show-phablet到结果\uu info u-hide-phabletts与新的数据But re.findallr'>.

'，strwinner对汤不起作用。find\u all'p'，class=result\uuuuu info u-hide-phablet我想知道是否有更好的方法来获取基于任何html元素的类的文本，并且每个类都有很多记录谢谢@Themis。。。for循环是我在尝试获取文本时没有尝试的东西

for p in soup.findAll("p", {"class" : "result__outcome u-hide-phablet"}):
    tags_text = p.text

for span in soup.findAll("span", {"class" : "result__score result__score--winner"}):
        tags_text = span.text