Python 如何使用应用于BeautifulSoup中的正则表达式从

Python 如何使用应用于BeautifulSoup中的正则表达式从,python,regex,web-scraping,beautifulsoup,Python,Regex,Web Scraping,Beautifulsoup,标记获取文本? 我已经用python编写了一些脚本,使用正则表达式从某些p标记中获取文本,但这个脚本给了我一个空列表 这是html元素的磁性部分: 目的是使用regex获取上述标记的文本 这就是我迄今为止所尝试的: winner = soup.find_all('p',class_="result__outcome u-hide-phablet") win_list = re.findall(r'>(.*?)</p>', str(winner)) 上面的部分生成空列表。在

标记获取文本? 我已经用python编写了一些脚本,使用正则表达式从某些p标记中获取文本,但这个脚本给了我一个空列表

这是html元素的磁性部分:

目的是使用regex获取上述标记的文本

这就是我迄今为止所尝试的:

winner = soup.find_all('p',class_="result__outcome u-hide-phablet") 
win_list = re.findall(r'>(.*?)</p>', str(winner)) 
上面的部分生成空列表。在此方面的任何帮助都将不胜感激


Post script:我正在寻找任何与regex相关的解决方案。

要访问您感兴趣的标记,您可以执行以下操作:

for p in soup.findAll("p", {"class" : "result__outcome u-hide-phablet"}):
    tags_text = p.text
对于span,您需要以相同的方式执行以下操作:

for span in soup.findAll("span", {"class" : "result__score result__score--winner"}):
        tags_text = span.text

这是为了获得每个标记中的文本,正如您在问题中所问的。

您在所提到的htmlI更正结果中没有类结果\uuu info u-show-phablet到结果\uu info u-hide-phabletts与新的数据But re.findallr'>.

',strwinner对汤不起作用。find\u all'p',class=result\uuuuu info u-hide-phablet我想知道是否有更好的方法来获取基于任何html元素的类的文本,并且每个类都有很多记录谢谢@Themis。。。for循环是我在尝试获取文本时没有尝试的东西
for p in soup.findAll("p", {"class" : "result__outcome u-hide-phablet"}):
    tags_text = p.text
for span in soup.findAll("span", {"class" : "result__score result__score--winner"}):
        tags_text = span.text