比较python中的两个html文本

比较python中的两个html文本,python,python-2.7,Python,Python 2.7,我有一个要求,即我在python中将html文本存储为字符串,并希望对它们进行比较 str1 = '<br> Example1' str2 = '<br/> Example1' html是不平等的。str2='Example'wherestr1也是如此=str2 有没有办法在python中实现这一点。我知道测试用例有self.assertInEmail,它可以进行html比较,但我不想在我的产品代码中使用测试函数。按空格分割,然后在空字符串上再次连接''.joi

我有一个要求,即我在python中将html文本存储为字符串,并希望对它们进行比较

str1 = '<br> Example1'
str2 = '<br/>     Example1'
html是不平等的。
str2='Example'
where
str1也是如此=str2


有没有办法在python中实现这一点。我知道测试用例有self.assertInEmail,它可以进行html比较,但我不想在我的产品代码中使用测试函数。

按空格分割,然后在空字符串上再次连接<代码>''.join(str1.split())=''.join(str2.split())。尽管这很快就会出错。如果您想完全比较HTML,最好使用BeautifulSoup这样的库。我想指出的是,即使在HTML中,这两个字符串也不相等。这些空格由浏览器保存,可以通过JavaScript(例如:)访问,因此额外空格字符的存在实际上会影响正在发生的事情。因此,正如@Evert所说,您可能想使用BeautifulSoup(或任何其他HTML解析器)并尝试分析两个DOM是否足够接近,可以被视为相等。我认为这个问题已经在通过空格拆分并在空字符串上再次连接中解决了<代码>''.join(str1.split())=''.join(str2.split())。尽管这很快就会出错。如果您想完全比较HTML,最好使用BeautifulSoup这样的库。我想指出的是,即使在HTML中,这两个字符串也不相等。这些空格由浏览器保存,可以通过JavaScript(例如:)访问,因此额外空格字符的存在实际上会影响正在发生的事情。因此,正如@Evert所说,您可能希望使用BeautifulSoup(或任何其他HTML解析器),并尝试分析两个DOM是否足够接近,可以被视为相等
str1 = '<br> Example1'
str2 = '<p> Example1'