Python将字符串转换为等效的HTML字符
假设我们有一根绳子Python将字符串转换为等效的HTML字符,python,python-2.7,encoding,html-encode,character-entities,Python,Python 2.7,Encoding,Html Encode,Character Entities,假设我们有一根绳子 布鲁斯·韦恩是蝙蝠侠 当我将此字符串转换为HTML字符时,输出将是 和#66ruce Wayne is Batman 我试图在Python2.7中找到一种实现这一点的方法。有人能建议怎么做吗 我已经在stackoverflow上搜索了所有地方,找到的所有答案都是如何转义HTML特殊字符。我不想转义
布鲁斯·韦恩是蝙蝠侠
当我将此字符串转换为HTML字符时,输出将是
和#66ruce Wayne is Batman代码>
我试图在Python2.7中找到一种实现这一点的方法。有人能建议怎么做吗
我已经在stackoverflow上搜索了所有地方,找到的所有答案都是如何转义HTML特殊字符。我不想转义特殊字符,而是将任何和所有字符串转换为它们的HTML字符等价物。mozila firefox的hackbar插件能够成功地实现这一点,我想使用python实现同样的功能
HTMLParse库还能够使用unescape()模块成功地对其进行解码。python中是否有一个库可以按照上面提到的方式对其进行编码?此外,我并不寻找像BeautifulSoup这样的外部库,而是一个内置库,因为它不会向工具添加依赖项。据我所知,标准库中没有任何东西可以做到这一点(将每个字符编码为其实体引用不是一件常见的事情),但进行转换的函数很简单:
def entitify(text):
return ''.join('&#%d;' % ord(c) for c in text)
该函数只需使用内置函数获取每个字符的字节值或代码点,并将其包装在编码>,然后将结果合并在一起。完成此工作。谢谢
>>> entitify('Bruce Wayne is Batman')
'Bruce Wayne is Batman'
>>> entitify(u'Rinôçérôse')
'Rinôçérôse'