Python 3:将ascii字符转换为unicode转义字符
我需要将ascii字符转换为unicode字符 例如:Python 3:将ascii字符转换为unicode转义字符,python,regex,python-3.x,parsing,unicode,Python,Regex,Python 3.x,Parsing,Unicode,我需要将ascii字符转换为unicode字符 例如: “&” 到 “\\u0026” 背景: 我在输入中收到两个值,第一个是字符串,另一个是包含一些内容的原始字节。 在此之后,在正则表达式中使用第一个字符串来捕获原始数据 teste=“teste的teste&teste” 原始='。。。。teste's teste\\u0026 teste',null,[“此处”,“此处2”]..” 在此之后,regex与第一个varteste一起使用,以获取varraw中的单词here,但在第一个var中的
“&”
到
“\\u0026”
背景:
我在输入中收到两个值,第一个是字符串,另一个是包含一些内容的原始字节。
在此之后,在正则表达式中使用第一个字符串来捕获原始数据
teste=“teste的teste&teste”
原始='。。。。teste's teste\\u0026 teste',null,[“此处”,“此处2”]..”
在此之后,regex与第一个varteste
一起使用,以获取varraw
中的单词here
,但在第一个var中的一些字符如&have的情况下,他无法在raw中找到任何模式,因为在raw中,var是unicode转义的
因此,我尝试将一些字符(如
&
转换为unicode escape)但没有成功非常感谢,我将暂时用以下方法解决此问题:
def escape_word(word):
whitelist = [" ", "'"] + list(string.ascii_letters)
new_word = ""
for _c in word:
if _c in whitelist:
new_word += _c
else:
new_word += "\\u%04x" % ord(_c)
return new_word
直到我找到更好的解决方案。什么HTML实体?您的字符串中没有HTML实体。如果我不清楚这个问题,很抱歉,但问题只是转换为unicode转义,因为在HTML实体表中有(&have),我写了这个,但是如果您不喜欢这个标题,您可以帮我为这个提供一个更好的标题吗?@ahogen,好的,我是整天都在搜索这个,也许我真的是个傻瓜,但是如果你找到了,你可以分享吗?&“已经是ASCII格式了;用
unicode escape
编码将没有效果。@IgnacioVazquez Abrams我需要这个来用regex搜索另一个他被转义的文本:\