Python 有没有一种方法可以识别和转换普通字符字符串中的非转义四位Unicode字符?

Python 有没有一种方法可以识别和转换普通字符字符串中的非转义四位Unicode字符?,python,python-3.x,unicode,python-unicode,unicode-string,Python,Python 3.x,Unicode,Python Unicode,Unicode String,我正在使用requests.get从Google Ngrams检索数据 我遇到了一个问题,当我在网站上查询带有重音字符的字符串时(在本例中,我搜索的是“marcher d'un pas lourd”),它会返回“marcher d';un pas lourd”的信息 正如您在返回的字符串中看到的,撇号已被四位Unicode替换为撇号 这会弄乱代码的其余部分,因为我使用原始字符串查询(“marcher d'un pas lourd”)从返回的数据中查找所需的数据 是否有任何函数或程序可以搜索

我正在使用requests.get从Google Ngrams检索数据

我遇到了一个问题,当我在网站上查询带有重音字符的字符串时(在本例中,我搜索的是
“marcher d'un pas lourd”
),它会返回
“marcher d';un pas lourd”
的信息

正如您在返回的字符串中看到的,撇号已被四位Unicode替换为撇号

这会弄乱代码的其余部分,因为我使用原始字符串查询(
“marcher d'un pas lourd”
)从返回的数据中查找所需的数据


是否有任何函数或程序可以搜索和转换一个普通字符字符串中的四位Unicode?请注意,我不想删除这些特殊字符,而是希望它们在代码中得到正确的表示

这些是调用HTML实体,它们可以通过以下方式取消替换:

>>> s="marcher d' un pas lourd"
>>> import html
>>> html.unescape(s)
"marcher d' un pas lourd"