Python无法读取带有外来字符的utf-8文件

Python无法读取带有外来字符的utf-8文件,python,python-2.7,pandas,utf-8,Python,Python 2.7,Pandas,Utf 8,我正在尝试使用pandas合并tsv文件,但无法使pandas正确返回文件内容。我的tsv文件包含意大利语,熊猫在重音字符方面失败,如a 我的tsv: EN IT and now a adesso can i change the brightness Posso modificare la luminosità 下面的块返回一个空结果集 import pandas as pd test = pd.read_csv('IT.tsv', delimiter='\t', encoding='ut

我正在尝试使用pandas合并tsv文件,但无法使pandas正确返回文件内容。我的tsv文件包含意大利语,熊猫在重音字符方面失败,如a

我的tsv:

EN  IT
and now a adesso
can i change the brightness Posso modificare la luminosità
下面的块返回一个空结果集

import pandas as pd
test = pd.read_csv('IT.tsv', delimiter='\t', encoding='utf-8')
print test

如果我把第三行末尾的a去掉,它就可以了。任何指针都会非常感激

编码不应该是标准的python编码(即“utf_8”,而不是“utf-8”)?@abolotnov
utf_8
是编码模块的名称(模块名称不能有破折号),但是
“utf-8”
作为编码名称是可以接受的。该示例在linux和utf-8终端上使用python 2.7.6为我工作。你在windows上吗?
sys.stdin.encoding
说什么。。。并不是说它对我有多大帮助……是的,我使用的是Windows,python 2.7.10。我是python新手,不知道如何处理
sys.stdin.encoding
,您介意再多说一点吗?对于记录来说,utf_8并没有什么不同。如果失败,文件的编码就不是utf-8。尝试使用
拉丁语-1
阅读,并检查结果,因为即使编码不正确,也可能成功。