Python Unicode错误序号不在范围内

Python Unicode错误序号不在范围内,python,unicode,Python,Unicode,对我来说,unicode出现了奇怪的错误。我处理unicode很好,但今天早上运行它时,有一项u'\u201d'给出了错误,并给了我 UnicodeError: ASCII encoding error: ordinal not in range(128) 我查找了代码,显然是utf-32,但当我尝试在解释器中解码时: c = u'\u201d' c.decode('utf-32', 'replace') 或者任何其他操作,它只是在任何编解码器中都无法识别,但我发现它是正确的双引号 我得到:

对我来说,unicode出现了奇怪的错误。我处理unicode很好,但今天早上运行它时,有一项u'\u201d'给出了错误,并给了我

UnicodeError: ASCII encoding error: ordinal not in range(128)
我查找了代码,显然是utf-32,但当我尝试在解释器中解码时:

c = u'\u201d'
c.decode('utf-32', 'replace')
或者任何其他操作,它只是在任何编解码器中都无法识别,但我发现它是正确的双引号

我得到:

Traceback (most recent call last):
File "<pyshell#154>", line 1, in <module>
    c.decode('utf-32')
  File "C:\Python27\lib\encodings\utf_32.py", line 11, in decode
    return codecs.utf_32_decode(input, errors, True)
UnicodeEncodeError: 'ascii' codec can't encode character u'\u201d' in position 0: ordinal not in range(128)

您已经有了一个unicode字符串,无需再次将其解码为unicode字符串

在这种情况下,python会很有帮助地尝试首先为您编码它,以便您可以从utf-32解码它。它使用默认编码来实现这一点,这恰好是ASCII编码。下面是一个显式编码,用于显示在这种情况下引发的异常:

>>> u'\u201d'.encode('ASCII')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode character u'\u201d' in position 0: ordinal not in range(128)
简而言之,当您有一个像u这样的unicode文本时,就不需要对其进行解码


阅读中的unicode、编码和默认设置。关于这一主题的另一篇非常有价值的文章是Joel Spolsky的文章。

关于unicode知识的伟大文章,我肯定是那些希望获得最佳效果的人之一,哈哈,但我仍然无法让特定代码出现@Kos:它适用于u'FF之类的伪编解码器。解码'hex'@rodling:你打算如何输出它?您需要对unicode值进行编码以显示或保存到文件中。c.encode'utf-32','replace'输出为:'\xff\xfe\x00\x00\x1d\x00\x00'@rodling:utf-32可以覆盖任何字符;这看起来像是完全有效的UTF-32,包括BOM表。