Python 如何转换字符串，如“quot\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167“；汉字_Python_String_Unicode

Python 如何转换字符串，如“quot\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167“；汉字

python string unicode

Python 如何转换字符串，如“quot\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167“；汉字,python,string,unicode,Python,String,Unicode,我现在正在开发一个小工具来请求和解码一个网页，其中的汉字以字符串形式存储 \u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167 在源代码中，使用unicode。我想把它转换成汉字我可以通过这个网站。但是如何使用python实现呢？这些已经是Unicode代码点了。它们表示汉字，但使用的转义码对开发人员来说更容易： >>> print u'\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82

我现在正在开发一个小工具来请求和解码一个网页，其中的汉字以字符串形式存储

\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167

在源代码中，使用unicode。我想把它转换成汉字

我可以通过这个网站。但是如何使用python实现呢？

这些已经是Unicode代码点了。它们表示汉字，但使用的转义码对开发人员来说更容易：

>>> print u'\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167'
小王子:汉法英对照

你不必做任何事情来改变这些；

\uxxx

转义形式只是表示相同代码点的另一种方式。见：

\uxxx

具有16位十六进制值xxxx的字符（仅限Unicode）

\uxxxxx

具有32位十六进制值xxxxxxxx的字符（仅限Unicode）

Python在读取源代码以构造unicode值时解释这些转义码

如果数据源不是来自Python源代码，而是来自web，则使用JSON数据，该数据使用相同的转义格式：

>>> import json
>>> print json.loads('"\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167"')
小王子:汉法英对照

请注意，该值需要是较大字符串的一部分，该字符串至少包含引号以将其标记为字符串

还请注意，JSON字符串转义格式在涉及非BMP（补充）代码点时与Python不同；JSON像UTF-16一样对待这些代码点，并使用两个

\uxxx

序列作为这样的代码点。在Python中，您将使用一个32位十六进制值。

这些已经是Unicode代码点了。它们表示汉字，但使用的转义码对开发人员来说更容易：

>>> print u'\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167'
小王子:汉法英对照

你不必做任何事情来改变这些；

\uxxx

转义形式只是表示相同代码点的另一种方式。见：

\uxxx

具有16位十六进制值xxxx的字符（仅限Unicode）

\uxxxxx

具有32位十六进制值xxxxxxxx的字符（仅限Unicode）

Python在读取源代码以构造unicode值时解释这些转义码

如果数据源不是来自Python源代码，而是来自web，则使用JSON数据，该数据使用相同的转义格式：

>>> import json
>>> print json.loads('"\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167"')
小王子:汉法英对照

请注意，该值需要是较大字符串的一部分，该字符串至少包含引号以将其标记为字符串

还请注意，JSON字符串转义格式在涉及非BMP（补充）代码点时与Python不同；JSON像UTF-16一样对待这些代码点，并使用两个

\uxxx

序列作为这样的代码点。在Python中，您将使用一个32位十六进制值。

在Python 3中，您不需要在字符串前面加u:

print（“\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167”）

但是我从网页获得的源代码字符串是这种格式的。因此，在python字符串中，内容是

\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167

。它不被识别为unicode。如何解决这个问题呢？那么您就有了JSON数据，正在更新。使用python 3，您不需要在字符串前面加u:

print（“\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167”）

，但我从网页获得的源代码字符串是这种格式的。因此，在python字符串中，内容是

\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167

。它不被识别为unicode。如何解决？那么您就有了JSON数据，正在更新。可能相关：。可能相关：。