Python 2.7 Unicode错误_Python_Python 2.7_Unicode

Python 2.7 Unicode错误

python python-2.7 unicode

Python 2.7 Unicode错误,python,python-2.7,unicode,Python,Python 2.7,Unicode,我在数据库的一个字段中存储了一个带有tildeñ的字母n，我的Django应用程序在尝试将其用作字符串时出现了一些问题当我访问REPL中的值时，它显示如下： >>> person.last_name u'xxxxxxa\xf1oxxxx' >>> str(person.last_name) Traceback (most recent call last): File "<console>", line 1, in <module>

我在数据库的一个字段中存储了一个带有tildeñ的字母n，我的Django应用程序在尝试将其用作字符串时出现了一些问题

当我访问REPL中的值时，它显示如下：

>>> person.last_name
u'xxxxxxa\xf1oxxxx'
>>> str(person.last_name)
Traceback (most recent call last):
  File "<console>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode character u'\xf1' in     position 15: ordinal not in range(128)

如果我错了，请纠正我-我认为\xf1字符串包含在Unicode字符串中是一个问题，在该值变为Unicode字符串之前，应该对其进行不同的处理。。。但我不知道这是一种症状还是真正的疾病

所以我不知道该怎么办。我是否一开始就错误地存储了这个值？也许我只是需要有人告诉我如何正确解码？我的目标是将此值写入CSV，最终需要通过str运行它。非常感谢

字符ñ是unicode字符U+00F1。因此，您看到的unicode字符串是正确的。Python显示转义\xf1，实际上是在unicode字符串（字符U+00F1）的上下文中

没有什么需要解码的，相反，如果您想将unicode字符串写入某个字节流（如文件），则需要对其进行编码

问题来自于使用strfoo，其中foo是unicode字符串。这相当于foo.encode'ascii'。但是，ASCII编码中不存在字符ñ，因此存在错误

相反，如果您想要unicode字符串的二进制编码表示形式，则必须知道需要哪种编码并手动编码：

>>> foo = u'xxxxxxa\xf1oxxxx'
>>> foo.encode('utf8')
'xxxxxxa\xc3\xb1oxxxx'
>>> foo.encode('latin1')
'xxxxxxa\xf1oxxxx'

只需确保使用CSV文件的编码，否则将使用无效字符

python 3 btw也是如此，只有unicode字符串是str类型，编码字符串是bytes类型：