Python2.7 UnicodeEncodeError:&x27;ascii';编解码器可以';t编码位置0-11的字符:序号不在范围内(128)

Python2.7 UnicodeEncodeError:&x27;ascii';编解码器可以';t编码位置0-11的字符:序号不在范围内(128),python,python-2.7,unicode,encoding,mojibake,Python,Python 2.7,Unicode,Encoding,Mojibake,我目前正在使用Python2.7,并在一个中文网站上进行网页抓取 如何将下面的unicode转换为字符串 Simple str()函数不工作,状态为 UnicodeEncodeError:“ascii”编解码器无法对位置0-11中的字符进行编码:序号不在范围内(128) 提前感谢, u'\n\xe4\xb8\xad\xe5\x9b\xbd\xe6\xb7\xb1\xe5\x9c\xb3\n' 您的字符串已经编码,因此它应该是字节对象而不是unicode对象。试着解决这个问题。i、 e.

我目前正在使用Python2.7,并在一个中文网站上进行网页抓取

如何将下面的unicode转换为字符串

Simple str()函数不工作,状态为 UnicodeEncodeError:“ascii”编解码器无法对位置0-11中的字符进行编码:序号不在范围内(128)

提前感谢,

    u'\n\xe4\xb8\xad\xe5\x9b\xbd\xe6\xb7\xb1\xe5\x9c\xb3\n'

您的字符串已经编码,因此它应该是字节对象而不是unicode对象。试着解决这个问题。i、 e.
repr
您的刮取数据应该如下所示:

'\n\xe4\xb8\xad\xe5\x9b\xbd\xe6\xb7\xb1\xe5\x9c\xb3\n'
不是这样的:

u'\n\xe4\xb8\xad\xe5\x9b\xbd\xe6\xb7\xb1\xe5\x9c\xb3\n'
要从unicode对象恢复中文文本,可以跳转到字节并返回:

>>> text = u'\n\xe4\xb8\xad\xe5\x9b\xbd\xe6\xb7\xb1\xe5\x9c\xb3\n'
>>> print text.encode('latin-1').decode('utf-8')

中国深圳
可能重复的