Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/string/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何转换字符串,如“quot\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167“;汉字_Python_String_Unicode - Fatal编程技术网

Python 如何转换字符串,如“quot\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167“;汉字

Python 如何转换字符串,如“quot\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167“;汉字,python,string,unicode,Python,String,Unicode,我现在正在开发一个小工具来请求和解码一个网页,其中的汉字以字符串形式存储 \u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167 在源代码中,使用unicode。我想把它转换成汉字 我可以通过这个网站。但是如何使用python实现呢?这些已经是Unicode代码点了。它们表示汉字,但使用的转义码对开发人员来说更容易: >>> print u'\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82

我现在正在开发一个小工具来请求和解码一个网页,其中的汉字以字符串形式存储

\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167 
在源代码中,使用unicode。我想把它转换成汉字


我可以通过这个网站。但是如何使用python实现呢?

这些已经是Unicode代码点了。它们表示汉字,但使用的转义码对开发人员来说更容易:

>>> print u'\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167'
小王子:汉法英对照
你不必做任何事情来改变这些;
\uxxx
转义形式只是表示相同代码点的另一种方式。见:

\uxxx

具有16位十六进制值xxxx的字符(仅限Unicode)
\uxxxxx

具有32位十六进制值xxxxxxxx的字符(仅限Unicode)

Python在读取源代码以构造unicode值时解释这些转义码

如果数据源不是来自Python源代码,而是来自web,则使用JSON数据,该数据使用相同的转义格式:

>>> import json
>>> print json.loads('"\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167"')
小王子:汉法英对照
请注意,该值需要是较大字符串的一部分,该字符串至少包含引号以将其标记为字符串


还请注意,JSON字符串转义格式在涉及非BMP(补充)代码点时与Python不同;JSON像UTF-16一样对待这些代码点,并使用两个
\uxxx
序列作为这样的代码点。在Python中,您将使用一个32位十六进制值。

这些已经是Unicode代码点了。它们表示汉字,但使用的转义码对开发人员来说更容易:

>>> print u'\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167'
小王子:汉法英对照
你不必做任何事情来改变这些;
\uxxx
转义形式只是表示相同代码点的另一种方式。见:

\uxxx

具有16位十六进制值xxxx的字符(仅限Unicode)
\uxxxxx

具有32位十六进制值xxxxxxxx的字符(仅限Unicode)

Python在读取源代码以构造unicode值时解释这些转义码

如果数据源不是来自Python源代码,而是来自web,则使用JSON数据,该数据使用相同的转义格式:

>>> import json
>>> print json.loads('"\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167"')
小王子:汉法英对照
请注意,该值需要是较大字符串的一部分,该字符串至少包含引号以将其标记为字符串


还请注意,JSON字符串转义格式在涉及非BMP(补充)代码点时与Python不同;JSON像UTF-16一样对待这些代码点,并使用两个
\uxxx
序列作为这样的代码点。在Python中,您将使用一个32位十六进制值。

在Python 3中,您不需要在字符串前面加u:
print(“\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167”)
但是我从网页获得的源代码字符串是这种格式的。因此,在python字符串中,内容是
\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167
。它不被识别为unicode。如何解决这个问题呢?那么您就有了JSON数据,正在更新。使用python 3,您不需要在字符串前面加u:
print(“\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167”)
,但我从网页获得的源代码字符串是这种格式的。因此,在python字符串中,内容是
\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167
。它不被识别为unicode。如何解决?那么您就有了JSON数据,正在更新。可能相关:。可能相关:。