python中的俄语字符解码
此问题仅适用于python: 我有一个俄语字符串中的城市名称,它是Unicode格式的python中的俄语字符解码,python,Python,此问题仅适用于python: 我有一个俄语字符串中的城市名称,它是Unicode格式的 \u041C\u043E\u0441\u043A\u0432\u0430 意味着 МаСаа 如何获取原始文本而不是unicode字符 注意:不要使用任何导入模块 >>> a=u"\u041C\u043E\u0441\u043A\u0432\u0430" >>> print a Москва 您的字符串是unicode字符串,因为每个带有\u的字符/代码点只能从unico
\u041C\u043E\u0441\u043A\u0432\u0430
意味着
МаСаа
如何获取原始文本而不是unicode字符
注意:不要使用任何导入模块
>>> a=u"\u041C\u043E\u0441\u043A\u0432\u0430"
>>> print a
Москва
您的字符串是unicode字符串,因为每个带有\u的字符/代码点只能从unicode字符串中使用,因此您应该在字符串前面加上u。否则为常规字符串,每个\u都算作常规ascii字符:
>>> len(a)
6
>>> b="\u041C\u043E\u0441\u043A\u0432\u0430"
>>> len(b)
36
您的字符串是unicode字符串,因为每个带有\u的字符/代码点只能从unicode字符串中使用,因此您应该在字符串前面加上u。否则为常规字符串,每个\u都算作常规ascii字符:
>>> len(a)
6
>>> b="\u041C\u043E\u0441\u043A\u0432\u0430"
>>> len(b)
36
除了vz0回答:注意脚本的编码 这个文件将非常有用:
#编码:utf-8
s=u“\u041C\u043E\u0441\u043A\u0432\u0430”
印刷品
但这将导致一个UnicodeDeer错误:
#编码:ASCII
s=u“\u041C\u043E\u0441\u043A\u0432\u0430”
印刷品
除了vz0回答:注意脚本的编码
这个文件将非常有用:
#编码:utf-8
s=u“\u041C\u043E\u0441\u043A\u0432\u0430”
印刷品
但这将导致一个UnicodeDeer错误:
#编码:ASCII
s=u“\u041C\u043E\u0441\u043A\u0432\u0430”
印刷品
我使用的界面不支持任何导入…py3或py2?有关于如何实现这一点的代码片段吗?只是出于好奇,什么样的接口不允许导入?我只想使用解码编码。我使用的接口不支持任何导入…py3或py2?有关于你是如何做到这一点的代码片段吗?只是出于好奇什么样的接口不允许导入?我只想使用解码编码现象,你确定吗?我认为第一个声明了源文件的编码,但是\u041C…
是完美的ASCII。如果你把coding:utf-8
放进去,那么下面的代码也应该会起作用:s=u“Маа”
,因为现在python知道(源)文件被编码为utf-8,并且正确地解码了unicode。在我的环境中,如果我把coding:ASCII
放进去,它就不起作用了,但它与coding:utf-8
一起起作用,对我来说都很奇怪(尽管我无法打印出来,因为windows终端无法正确编码)但是这里我只有Python3.5.2可用,可能处理方式也改变了。你确定吗?我认为第一个声明了源文件的编码,但是\u041C…
是完美的ASCII。如果你把编码:utf-8
放进去,那么下面的代码也应该起作用:s=u“МССа”
,因为现在python知道(源代码)文件编码为utf-8并正确解码unicode。在我的环境中,如果我使用编码:ASCII
,它就不起作用,但使用编码:utf-8
奇数,对我来说两者都起作用(尽管我无法打印出来,因为windows终端无法正确编码).但这里我只有Python3.5.2可用,可能处理方式也改变了。