python中的俄语字符解码

python中的俄语字符解码,python,Python,此问题仅适用于python: 我有一个俄语字符串中的城市名称,它是Unicode格式的 \u041C\u043E\u0441\u043A\u0432\u0430 意味着 МаСаа 如何获取原始文本而不是unicode字符 注意:不要使用任何导入模块 >>> a=u"\u041C\u043E\u0441\u043A\u0432\u0430" >>> print a Москва 您的字符串是unicode字符串,因为每个带有\u的字符/代码点只能从unico

此问题仅适用于python:

我有一个俄语字符串中的城市名称,它是Unicode格式的

\u041C\u043E\u0441\u043A\u0432\u0430

意味着

МаСаа

如何获取原始文本而不是unicode字符

注意:不要使用任何导入模块

>>> a=u"\u041C\u043E\u0441\u043A\u0432\u0430"
>>> print a
Москва
您的字符串是unicode字符串,因为每个带有\u的字符/代码点只能从unicode字符串中使用,因此您应该在字符串前面加上u。否则为常规字符串,每个\u都算作常规ascii字符:

>>> len(a)
6
>>> b="\u041C\u043E\u0441\u043A\u0432\u0430"
>>> len(b)
36
您的字符串是unicode字符串,因为每个带有\u的字符/代码点只能从unicode字符串中使用,因此您应该在字符串前面加上u。否则为常规字符串,每个\u都算作常规ascii字符:

>>> len(a)
6
>>> b="\u041C\u043E\u0441\u043A\u0432\u0430"
>>> len(b)
36

除了vz0回答:注意脚本的编码

这个文件将非常有用:

#编码:utf-8
s=u“\u041C\u043E\u0441\u043A\u0432\u0430”
印刷品
但这将导致一个UnicodeDeer错误:

#编码:ASCII
s=u“\u041C\u043E\u0441\u043A\u0432\u0430”
印刷品

除了vz0回答:注意脚本的编码

这个文件将非常有用:

#编码:utf-8
s=u“\u041C\u043E\u0441\u043A\u0432\u0430”
印刷品
但这将导致一个UnicodeDeer错误:

#编码:ASCII
s=u“\u041C\u043E\u0441\u043A\u0432\u0430”
印刷品

我使用的界面不支持任何导入…py3或py2?有关于如何实现这一点的代码片段吗?只是出于好奇,什么样的接口不允许导入?我只想使用解码编码。我使用的接口不支持任何导入…py3或py2?有关于你是如何做到这一点的代码片段吗?只是出于好奇什么样的接口不允许导入?我只想使用解码编码现象,你确定吗?我认为第一个声明了源文件的编码,但是
\u041C…
是完美的ASCII。如果你把
coding:utf-8
放进去,那么下面的代码也应该会起作用:
s=u“Маа”
,因为现在python知道(源)文件被编码为utf-8,并且正确地解码了unicode。在我的环境中,如果我把
coding:ASCII
放进去,它就不起作用了,但它与
coding:utf-8
一起起作用,对我来说都很奇怪(尽管我无法打印出来,因为windows终端无法正确编码)但是这里我只有Python3.5.2可用,可能处理方式也改变了。你确定吗?我认为第一个声明了源文件的编码,但是
\u041C…
是完美的ASCII。如果你把
编码:utf-8
放进去,那么下面的代码也应该起作用:
s=u“МССа”
,因为现在python知道(源代码)文件编码为utf-8并正确解码unicode。在我的环境中,如果我使用
编码:ASCII
,它就不起作用,但使用
编码:utf-8
奇数,对我来说两者都起作用(尽管我无法打印出来,因为windows终端无法正确编码).但这里我只有Python3.5.2可用,可能处理方式也改变了。