在python中删除html标记和时出现问题\r\n

在python中删除html标记和时出现问题\r\n,html,python-3.x,regex,parsing,Html,Python 3.x,Regex,Parsing,您好,请将此电子邮件转换为字符串。我用过这个 重新导入 def cleanhtml(原始html): cleanr=re.compile(“| \\r\\n\\r\\n |&([a-z0-9]+|#[0-9]{1,6}| x[0-9a-f]{1,6}”)) cleantext=re.sub(cleanr',原始html) #cleantext=re.sub('[%s]'%re.escape(“!”#$%&'()*+,-./:;?@[\]^ `{}~”),cleantext)#删除标点符号 cle

您好,请将此电子邮件转换为字符串。我用过这个

重新导入
def cleanhtml(原始html):
cleanr=re.compile(“| \\r\\n\\r\\n |&([a-z0-9]+|#[0-9]{1,6}| x[0-9a-f]{1,6}”))
cleantext=re.sub(cleanr',原始html)
#cleantext=re.sub('[%s]'%re.escape(“!”#$%&'()*+,-./:;?@[\]^ `{}~”),cleantext)#删除标点符号
cleantext=re.sub('\s+','',cleantext)#删除额外的空白
#cleantext=re.sub(r'\r\n','',cleantext)
返回干净文本
删除HTML标记,但仍保留一些\r\n

b'Hi Florend,\r\n\r\n早上好!\r\n\r\n希望一切都好。我只想自我介绍。我会帮你找到你的新家。\r\n请随时打电话给我,讨论你的需要。\r\n\r\n祝你今天愉快!\r\n\r\n玛吉“P.Gonzales\r\nWeichert Realtors\r\n251华盛顿街\r\nJersey市,NJ 07302\r\nCell:551-998-7128\r\n网站:margarita Gonzales.weichert.com\r\n\r\n邮箱:magonzales@weichert.com magonzales@weichert.com\r\nExecutive&Million Dollars Sales Club\r\nJar卓越圈\r\n\r\n\r\n顺便说一句,我从来都不会太忙而无法推荐给你的家人和朋友\r\n' b'\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\n\r\nHi Florend,

\r\n创造新闻!你与火箭家园房地产有限责任公司的一名顶级房地产经纪人玛吉·冈萨雷斯(Margie Gonzales)匹配

\r\n希望在24小时内收到Margie的来信。如果尚未联系到您,请随时联系您的代理人。

\r\n Margie Gonzales

\r\nWeicher房地产经纪人

\r\n电话:(551)998-7128

\r\n工作电话:(201)860-4009

\r\n邮箱地址:MaGonzales@weichert.com

\r\n

\r\n我会跟进,确保您在整个体验过程中都感到满意。如果您有任何问题或需要与您的代理联系的帮助,您可以随时联系我。

\r\n银行,

\r\n\t\nKelly Grace\n
执行代理协调员\n
(313)373-6612\n
C(248)930-6311\n\t
\n\t
\n\n\t