Python Regexp查找HTML表单的内容

Python Regexp查找HTML表单的内容,python,regex,Python,Regex,我很难找到HTML表单的内容(或任何其他标记)。我试过了 forms = re.findall('<form.*/form>', htmltext) forms=re.findall(“”,htmltext) 但是没有结果。错误在哪里?除非表单在一行上,否则该行不起作用,您需要将re.DOTALL作为一个选项 forms = re.findall('<form.*/form>', htmltext, re.DOTALL) forms=re.findall(“

我很难找到HTML表单的内容(或任何其他标记)。我试过了

    forms = re.findall('<form.*/form>', htmltext)
forms=re.findall(“”,htmltext)

但是没有结果。错误在哪里?

除非表单在一行上,否则该行不起作用,您需要将re.DOTALL作为一个选项

forms = re.findall('<form.*/form>', htmltext, re.DOTALL)
forms=re.findall(“”,htmltext,re.DOTALL)

您可以使用re.IGNORECASE | re.DOTALL,以防您需要捕获类似
的内容,您最好使用HTML解析器;BeautifulSoup非常棒。感谢两人的建议。我仍然不明白为什么regexp不起作用。从来没有用regex解析过html。请阅读谢谢,那些真的让人大开眼界!但是,如果我在上面发布的行(当然已更正)是我在程序中需要的唯一解析,该怎么办?是否仍然值得导入外部库或使用更多的代码行(例如HTMLPasser)?