在Python 2.6中,用相应的utf-8字符替换html实体

在Python 2.6中,用相应的utf-8字符替换html实体,python,html-entities,python-2.6,Python,Html Entities,Python 2.6,我的html文本如下所示: &lt;xml ... &gt; 我想把它转换成可读的东西: <xml ...> 在Python中有什么简单(快速)的方法吗?Python2.7 HTMLPasser的官方文档: Python 3 HTMLPasser的官方文档: 正如弗雷德在博文中指出的那样,有一个函数可以做到这一点。复制到这里是为了让事情更简单 弗雷德·拉森(Fred Larson)链接到了另一个问题。 将链接发布到dF 现代Python 3方法: >&g

我的html文本如下所示:

&lt;xml ... &gt;
我想把它转换成可读的东西:

<xml ...>

在Python中有什么简单(快速)的方法吗?

Python2.7 HTMLPasser的官方文档:

Python 3 HTMLPasser的官方文档:

正如弗雷德在博文中指出的那样,有一个函数可以做到这一点。复制到这里是为了让事情更简单

弗雷德·拉森(Fred Larson)链接到了另一个问题。
将链接发布到dF

现代Python 3方法:

>>> import html
>>> html.unescape('&copy; &euro;')
© €

我认为这个问题是重复的:这里最佳方法的可能重复unescape只是HTMLParser的一个内部函数(您的链接中没有记录)。但是,我可以使用实现。10倍alot@brtzsnr:没错,这是没有文件记录的。但不要认为它是内部的,毕竟它的名字是unescape而不是unescape或uunescape。
>>> from html.parser import HTMLParser
>>> pars = HTMLParser()
>>> pars.unescape('&copy; &euro;')
© €
>>> import html
>>> html.unescape('&copy; &euro;')
© €