Python 3:将ascii字符转换为unicode转义字符

Python 3:将ascii字符转换为unicode转义字符,python,regex,python-3.x,parsing,unicode,Python,Regex,Python 3.x,Parsing,Unicode,我需要将ascii字符转换为unicode字符 例如: “&” 到 “\\u0026” 背景: 我在输入中收到两个值,第一个是字符串,另一个是包含一些内容的原始字节。 在此之后,在正则表达式中使用第一个字符串来捕获原始数据 teste=“teste的teste&teste” 原始='。。。。teste's teste\\u0026 teste',null,[“此处”,“此处2”]..” 在此之后,regex与第一个varteste一起使用,以获取varraw中的单词here,但在第一个var中的

我需要将ascii字符转换为unicode字符

例如:
“&”
“\\u0026”

背景:

我在输入中收到两个值,第一个是字符串,另一个是包含一些内容的原始字节。 在此之后,在正则表达式中使用第一个字符串来捕获原始数据

teste=“teste的teste&teste”
原始='。。。。teste's teste\\u0026 teste',null,[“此处”,“此处2”]..”

在此之后,regex与第一个var
teste
一起使用,以获取var
raw
中的单词
here
,但在第一个var中的一些字符如&have的情况下,他无法在raw中找到任何模式,因为在raw中,var是unicode转义的


因此,我尝试将一些字符(如
&
转换为unicode escape)但没有成功

非常感谢,我将暂时用以下方法解决此问题:

def escape_word(word):
    whitelist = [" ", "'"] + list(string.ascii_letters)
    new_word = ""
    for _c in word:
        if _c in whitelist:
            new_word += _c
        else:
            new_word += "\\u%04x" % ord(_c)
    return new_word

直到我找到更好的解决方案。

什么HTML实体?您的字符串中没有HTML实体。如果我不清楚这个问题,很抱歉,但问题只是转换为unicode转义,因为在HTML实体表中有(&have),我写了这个,但是如果您不喜欢这个标题,您可以帮我为这个提供一个更好的标题吗?@ahogen,好的,我是整天都在搜索这个,也许我真的是个傻瓜,但是如果你找到了,你可以分享吗?&“已经是ASCII格式了;用
unicode escape
编码将没有效果。@IgnacioVazquez Abrams我需要这个来用regex搜索另一个他被转义的文本:\