在iPython中转置数据帧时获取UnicodeDecodeError

在iPython中转置数据帧时获取UnicodeDecodeError,python,ipython-notebook,utf,Python,Ipython Notebook,Utf,我正在导入excel表格,然后我想切换表格的列和行。这就是我得到的错误: “UnicodeDecodeError:'ascii'编解码器无法解码位置23389:序号不在范围(128)中的字节0xc3” 我试图用 decode('utf-8'),但它表示DataFrame没有这样的属性 发生此错误的原因是转置无法将某些数据转换为ascii。是这样吗?但是,当我的表是纯数字时,为什么我们需要这样做呢 非常感谢你 有关错误的详细信息如下: -------------------------------

我正在导入excel表格,然后我想切换表格的列和行。这就是我得到的错误: “UnicodeDecodeError:'ascii'编解码器无法解码位置23389:序号不在范围(128)中的字节0xc3”

我试图用 decode('utf-8'),但它表示DataFrame没有这样的属性

发生此错误的原因是转置无法将某些数据转换为ascii。是这样吗?但是,当我的表是纯数字时,为什么我们需要这样做呢

非常感谢你

有关错误的详细信息如下:

---------------------------------------------------------------------------
UnicodeDecodeError                        Traceback (most recent call last)
<ipython-input-190-a252f2a45657> in <module>()
      1 #your code here
      2 countries = countries.transpose()
----> 3 income.transpose()
      4 #income = income.decode('utf-8')
      5 #content = content.decode('utf-8')

/Users/Sergey/anaconda/lib/python2.7/site-packages/IPython/core/displayhook.pyc in __call__(self, result)
    236                 self.write_format_data(format_dict, md_dict)
    237                 self.log_output(format_dict)
--> 238             self.finish_displayhook()
    239 
    240     def cull_cache(self):

/Users/Sergey/anaconda/lib/python2.7/site-packages/IPython/kernel/zmq/displayhook.pyc in finish_displayhook(self)
     70         sys.stderr.flush()
     71         if self.msg['content']['data']:
---> 72             self.session.send(self.pub_socket, self.msg, ident=self.topic)
     73         self.msg = None
     74 

/Users/Sergey/anaconda/lib/python2.7/site-packages/IPython/kernel/zmq/session.pyc in send(self, stream, msg_or_type, content, parent, ident, buffers, track, header, metadata)
    647         if self.adapt_version:
    648             msg = adapt(msg, self.adapt_version)
--> 649         to_send = self.serialize(msg, ident)
    650         to_send.extend(buffers)
    651         longest = max([ len(s) for s in to_send ])

/Users/Sergey/anaconda/lib/python2.7/site-packages/IPython/kernel/zmq/session.pyc in serialize(self, msg, ident)
    551             content = self.none
    552         elif isinstance(content, dict):
--> 553             content = self.pack(content)
    554         elif isinstance(content, bytes):
    555             # content is already packed, as in a relayed message

/Users/Sergey/anaconda/lib/python2.7/site-packages/IPython/kernel/zmq/session.pyc in <lambda>(obj)
     83 # disallow nan, because it's not actually valid JSON
     84 json_packer = lambda obj: jsonapi.dumps(obj, default=date_default,
---> 85     ensure_ascii=False, allow_nan=False,
     86 )
     87 json_unpacker = lambda s: jsonapi.loads(s)

/Users/Sergey/anaconda/lib/python2.7/site-packages/zmq/utils/jsonapi.pyc in dumps(o, **kwargs)
     38         kwargs['separators'] = (',', ':')
     39 
---> 40     s = jsonmod.dumps(o, **kwargs)
     41 
     42     if isinstance(s, unicode):

/Users/Sergey/anaconda/lib/python2.7/json/__init__.pyc in dumps(obj, skipkeys, ensure_ascii, check_circular, allow_nan, cls, indent, separators, encoding, default, sort_keys, **kw)
    248         check_circular=check_circular, allow_nan=allow_nan, indent=indent,
    249         separators=separators, encoding=encoding, default=default,
--> 250         sort_keys=sort_keys, **kw).encode(obj)
    251 
    252 

/Users/Sergey/anaconda/lib/python2.7/json/encoder.pyc in encode(self, o)
    208         if not isinstance(chunks, (list, tuple)):
    209             chunks = list(chunks)
--> 210         return ''.join(chunks)
    211 
    212     def iterencode(self, o, _one_shot=False):

UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 23389: ordinal not in range(128)

但当我删除这个和平时,它仍然有效。有人知道为什么吗?谢谢

如果不了解ipython会话的更多具体知识,就很难权威地回答问题,但以下是一些有根据的猜测:

至于为什么会出现这种错误,即使您的数据都是数字,也很可能是来自某个索引标签(可能包含一些文本)

至于为什么删除代码时它仍然有效,如果您在iPython笔记本中工作,那么一旦您运行代码,将默认编码设置为utf-8,该设置将保持有效,直到

  • 运行其他一些更改设置的代码,或
  • 重新启动python内核

当您说其中一个标签时,您的意思是其中一个数据单元可能包含文本?这是一个巨大的数据帧,我想我无法手动找到导致错误的单元格。但我很好奇,从字面上看,这个细胞包含的是“234”,而不是234。是吗?我的意思是我认为它可能是行或列名中的一个非ascii字符。
#encoding=utf8 
import sys
reload(sys)  
sys.setdefaultencoding('utf8')