Python 3：将ascii字符转换为unicode转义字符_Python_Regex_Python 3.x_Parsing_Unicode

Python 3：将ascii字符转换为unicode转义字符

python regex python-3.x parsing unicode

Python 3：将ascii字符转换为unicode转义字符,python,regex,python-3.x,parsing,unicode,Python,Regex,Python 3.x,Parsing,Unicode,我需要将ascii字符转换为unicode字符例如： “&” 到 “\\u0026” 背景：我在输入中收到两个值，第一个是字符串，另一个是包含一些内容的原始字节。在此之后，在正则表达式中使用第一个字符串来捕获原始数据 teste=“teste的teste&teste” 原始='。。。。teste's teste\\u0026 teste'，null，[“此处”，“此处2”]..” 在此之后，regex与第一个varteste一起使用，以获取varraw中的单词here，但在第一个var中的

我需要将ascii字符转换为unicode字符

例如：

“&”

到

“\\u0026”

背景：

我在输入中收到两个值，第一个是字符串，另一个是包含一些内容的原始字节。在此之后，在正则表达式中使用第一个字符串来捕获原始数据

teste=“teste的teste&teste”
原始='。。。。teste's teste\\u0026 teste'，null，[“此处”，“此处2”]..”

在此之后，regex与第一个var

teste

一起使用，以获取var

raw

中的单词

here

，但在第一个var中的一些字符如&have的情况下，他无法在raw中找到任何模式，因为在raw中，var是unicode转义的

因此，我尝试将一些字符（如

转换为unicode escape）但没有成功

非常感谢，我将暂时用以下方法解决此问题：

def escape_word(word):
    whitelist = [" ", "'"] + list(string.ascii_letters)
    new_word = ""
    for _c in word:
        if _c in whitelist:
            new_word += _c
        else:
            new_word += "\\u%04x" % ord(_c)
    return new_word

直到我找到更好的解决方案。

什么HTML实体？您的字符串中没有HTML实体。如果我不清楚这个问题，很抱歉，但问题只是转换为unicode转义，因为在HTML实体表中有（&have），我写了这个，但是如果您不喜欢这个标题，您可以帮我为这个提供一个更好的标题吗？@ahogen，好的，我是整天都在搜索这个，也许我真的是个傻瓜，但是如果你找到了，你可以分享吗？&“已经是ASCII格式了；用

unicode escape

编码将没有效果。@IgnacioVazquez Abrams我需要这个来用regex搜索另一个他被转义的文本：\