Python 2.7 带有Python的正则表达式找不到正确的正则表达式

Python 2.7 带有Python的正则表达式找不到正确的正则表达式,python-2.7,helpers,web-clips,Python 2.7,Helpers,Web Clips,我正试图为一个项目从一个设计糟糕的网页中提取一些文本,经过长时间的研究和学习python之后,我几乎实现了这一点,但是网页设计糟糕,找不到合适的正则表达式 这就是我所取得的成就。从这个网页的源代码中,我想得到一个公认问题的第一个实例的全部内容。所以我想到了这个 exprespatFinderTitle = re.compile('<table id="submission" class="volume">.*(<tr class=.*>.*<label class=

我正试图为一个项目从一个设计糟糕的网页中提取一些文本,经过长时间的研究和学习python之后,我几乎实现了这一点,但是网页设计糟糕,找不到合适的正则表达式

这就是我所取得的成就。从这个网页的源代码中,我想得到一个公认问题的第一个实例的全部内容。所以我想到了这个

exprespatFinderTitle = re.compile('<table id="submission" class="volume">.*(<tr class=.*>.*<label class="AC">.*Accepted.*</label>.*</tr>).*</table>') 
exprespatFinderTitle=re.compile('.*(....*已接受.......*'))
但是,这样做的目的是剪切到表的最后一个
。有人能帮我弄清楚吗


我使用Python2.7,其中包含BeautifulSoup和urllib

只使用BeautifulSoup;正则表达式不是HTML解析的工具:

table = soup.find('table', id='submission')
accepted = table.tbody.find('label', class_='AC')
if accepted:
    row = accepted.parent.parent  # row with accepted column

如果您使用的是BeautifulSoup,为什么还要使用正则表达式?我已经尝试过使用BeautifulSoup,但我更接近正则表达式。如果我发布我的源代码会有帮助吗?好吧,非常感谢,这真的很有帮助,我已经连续8个小时试图弄明白这一点了。我要再次感谢你:)