python中的俄语字符解码_Python

python中的俄语字符解码

python

python中的俄语字符解码,python,Python,此问题仅适用于python：我有一个俄语字符串中的城市名称，它是Unicode格式的 \u041C\u043E\u0441\u043A\u0432\u0430 意味着 МаСаа 如何获取原始文本而不是unicode字符注意：不要使用任何导入模块 >>> a=u"\u041C\u043E\u0441\u043A\u0432\u0430" >>> print a Москва 您的字符串是unicode字符串，因为每个带有\u的字符/代码点只能从unico

此问题仅适用于python：

我有一个俄语字符串中的城市名称，它是Unicode格式的

\u041C\u043E\u0441\u043A\u0432\u0430

意味着

МаСаа

如何获取原始文本而不是unicode字符

注意：不要使用任何导入模块

>>> a=u"\u041C\u043E\u0441\u043A\u0432\u0430"
>>> print a
Москва

您的字符串是unicode字符串，因为每个带有\u的字符/代码点只能从unicode字符串中使用，因此您应该在字符串前面加上u。否则为常规字符串，每个\u都算作常规ascii字符：

>>> len(a)
6
>>> b="\u041C\u043E\u0441\u043A\u0432\u0430"
>>> len(b)
36

>>> len(a)
6
>>> b="\u041C\u043E\u0441\u043A\u0432\u0430"
>>> len(b)
36

除了vz0回答：注意脚本的编码

这个文件将非常有用：

#编码：utf-8 s=u“\u041C\u043E\u0441\u043A\u0432\u0430” 印刷品
但这将导致一个UnicodeDeer错误：

#编码：ASCII s=u“\u041C\u043E\u0441\u043A\u0432\u0430” 印刷品
除了vz0回答：注意脚本的编码
这个文件将非常有用：

#编码：utf-8 s=u“\u041C\u043E\u0441\u043A\u0432\u0430” 印刷品
但这将导致一个UnicodeDeer错误：

#编码：ASCII s=u“\u041C\u043E\u0441\u043A\u0432\u0430” 印刷品
我使用的界面不支持任何导入…py3或py2？有关于如何实现这一点的代码片段吗？只是出于好奇，什么样的接口不允许导入？我只想使用解码编码。我使用的接口不支持任何导入…py3或py2？有关于你是如何做到这一点的代码片段吗？只是出于好奇什么样的接口不允许导入？我只想使用解码编码现象，你确定吗？我认为第一个声明了源文件的编码，但是
\u041C…
是完美的ASCII。如果你把
coding:utf-8
放进去，那么下面的代码也应该会起作用：
s=u“Маа”
，因为现在python知道（源）文件被编码为utf-8，并且正确地解码了unicode。在我的环境中，如果我把
coding:ASCII
放进去，它就不起作用了，但它与
coding:utf-8
一起起作用，对我来说都很奇怪（尽管我无法打印出来，因为windows终端无法正确编码）但是这里我只有Python3.5.2可用，可能处理方式也改变了。你确定吗？我认为第一个声明了源文件的编码，但是
\u041C…
是完美的ASCII。如果你把
编码：utf-8
放进去，那么下面的代码也应该起作用：
s=u“МССа”
，因为现在python知道（源代码）文件编码为utf-8并正确解码unicode。在我的环境中，如果我使用
编码：ASCII
，它就不起作用，但使用
编码：utf-8
奇数，对我来说两者都起作用（尽管我无法打印出来，因为windows终端无法正确编码）.但这里我只有Python3.5.2可用，可能处理方式也改变了。