在python中转换unicode字符串

在python中转换unicode字符串,python,unicode,dictionary,Python,Unicode,Dictionary,这是我的对象的输出。我想进入城市,但它是编码的。如何读取所有参数并对其进行解码 {u'Status': u'OK', u'City': u'Ciri\xe8', u'TimezoneName': '', u'ZipPostalCode': '', u'CountryCode': u'IT', u'Dstoffset': u'0', u'Ip': u'x.x.x.x', u'Longitude': u'7.6', u'CountryName': u'Italy', u'RegionCode': u

这是我的对象的输出。我想进入城市,但它是编码的。如何读取所有参数并对其进行解码

{u'Status': u'OK', u'City': u'Ciri\xe8', u'TimezoneName': '', u'ZipPostalCode': '', u'CountryCode': u'IT', u'Dstoffset': u'0', u'Ip': u'x.x.x.x', u'Longitude': u'7.6', u'CountryName': u'Italy', u'RegionCode': u'12', u'Latitude': u'45.2333', u'Isdst': '', u'Gmtoffset': u'0', u'RegionName': u'Piemonte'}
>数据['City']
u'Ciri\xe8'
>>>数据['City'].解码('utf-8')
回溯(最近一次呼叫最后一次):
文件“”,第1行,在
文件“/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/encodings/utf_8.py”,第16行,解码
返回编解码器.utf_8_解码(输入,错误,真)
UnicodeEncodeError:“ascii”编解码器无法对位置4中的字符u'\xe8'进行编码:序号不在范围内(128)

我想要纯文本而不是unicode字符串。谢谢大家!

我想你所说的明文是指ascii码。为此,您可以使用:

>>> data['City']
u'Ciri\xe8'

>>>data['City'].decode('utf-8')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/encodings/utf_8.py", line 16, in decode
    return codecs.utf_8_decode(input, errors, True)
UnicodeEncodeError: 'ascii' codec can't encode character u'\xe8' in position 4: ordinal not in range(128)
这将去除unicode字符并返回

data['City'].encode('ascii','ignore')

有关更多信息,请参阅此链接:

您想要什么还不清楚。如果“纯文本”的意思是删除重音,请尝试以下操作:

Ciri
请阅读以下内容:

然后打印出来:

>>> s = u'Ciri\xe8'
>>> from unicodedata import normalize
>>> normalize('NFKD', s).encode('ASCII', 'ignore')
'Cirie'
如果不打印它,Python将打印字符串的安全表示形式,指示它是Unicode文本
u'
,并且它包含一个非ASCII字符
\xe8
<代码>打印尝试通过在终端编码中编码Unicode字符串来显示非ASCII字符。如果字符串包含终端编码不支持的字符,则可能会失败:

>>> data = {u'City':u'Ciri\xe8'}
>>> data['City']
u'Ciri\xe8'
>>> print data['City']
Ciriè
>>打印u'\xe8'
è
>>>打印u'\x81'
回溯(最近一次呼叫最后一次):
文件“”,第1行,在
文件“d:\dev\Python27\lib\encodings\cp437.py”,第12行,在encode中
返回编解码器.charmap\u encode(输入、错误、编码\u映射)
UnicodeEncodeError:“charmap”编解码器无法对位置0中的字符u'\x81'进行编码:字符映射到

在上面的示例中,支持Unicode字符U+00E8,但不支持U+0081。

我使用的代码没有“明文”这类东西。您不必做任何事情。它已经被解码了。。。尝试打印数据['City']正如您在帖子中看到的,打印数据['City']的结果是u'Ciri\xe8'不,您只需键入
数据['City']
。请尝试打印数据['City']。对我来说,在iPython,这很重要。
>>> print u'\xe8'
è
>>> print u'\x81'
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "d:\dev\Python27\lib\encodings\cp437.py", line 12, in encode
    return codecs.charmap_encode(input,errors,encoding_map)
UnicodeEncodeError: 'charmap' codec can't encode character u'\x81' in position 0: character maps to <undefined>