Python 2.7 带有Python的正则表达式找不到正确的正则表达式_Python 2.7_Helpers_Web Clips

Python 2.7 带有Python的正则表达式找不到正确的正则表达式

python-2.7

Python 2.7 带有Python的正则表达式找不到正确的正则表达式,python-2.7,helpers,web-clips,Python 2.7,Helpers,Web Clips,我正试图为一个项目从一个设计糟糕的网页中提取一些文本，经过长时间的研究和学习python之后，我几乎实现了这一点，但是网页设计糟糕，找不到合适的正则表达式这就是我所取得的成就。从这个网页的源代码中，我想得到一个公认问题的第一个实例的全部内容。所以我想到了这个 exprespatFinderTitle = re.compile('<table id="submission" class="volume">.*(<tr class=.*>.*<label class=

我正试图为一个项目从一个设计糟糕的网页中提取一些文本，经过长时间的研究和学习python之后，我几乎实现了这一点，但是网页设计糟糕，找不到合适的正则表达式

这就是我所取得的成就。从这个网页的源代码中，我想得到一个公认问题的第一个实例的全部内容。所以我想到了这个

exprespatFinderTitle = re.compile('<table id="submission" class="volume">.*(<tr class=.*>.*<label class="AC">.*Accepted.*</label>.*</tr>).*</table>')

exprespatFinderTitle=re.compile（'.*（....*已接受.......*'））

但是，这样做的目的是剪切到表的最后一个

。有人能帮我弄清楚吗

我使用Python2.7，其中包含BeautifulSoup和urllib

只使用BeautifulSoup；正则表达式不是HTML解析的工具：

table = soup.find('table', id='submission')
accepted = table.tbody.find('label', class_='AC')
if accepted:
    row = accepted.parent.parent  # row with accepted column

如果您使用的是BeautifulSoup，为什么还要使用正则表达式？我已经尝试过使用BeautifulSoup，但我更接近正则表达式。如果我发布我的源代码会有帮助吗？好吧，非常感谢，这真的很有帮助，我已经连续8个小时试图弄明白这一点了。我要再次感谢你：）