Python 从文件中读取希腊字母_Python_Python 2.7_Unicode

Python 从文件中读取希腊字母

python python-2.7 unicode

Python 从文件中读取希腊字母,python,python-2.7,unicode,Python,Python 2.7,Unicode,我有一个.csv文件，其中包含一定数量的列。其中一列有几个值，称为Δ（希腊字母Delta）我试着打印这封信，我成功了： print u'\u0394' 正确返回希腊字母但是，如果我尝试在名为'column'的列中选择包含Δ的文件行，请使用 file=pd.read_csv('filename.csv',sep=';') print file[file['column']==u'\u0394'] 我发现自己的列表是空的，尽管我知道某些行在该列中确实有Δ 我做错了什么？您必须添加encod

我有一个.csv文件，其中包含一定数量的列。其中一列有几个值，称为

Δ

（希腊字母Delta）

我试着打印这封信，我成功了：

print u'\u0394'

正确返回希腊字母

但是，如果我尝试在名为

'column'

的列中选择包含

Δ的文件行，请使用
file=pd.read_csv('filename.csv',sep=';')
print file[file['column']==u'\u0394']


我发现自己的列表是空的，尽管我知道某些行在该列中确实有Δ
我做错了什么？
您必须添加encoding='utf-8'
来读取\u csv，因为python 2不默认为unicode字符串（字节字符串不能处理增量）。您什么也得不到，因为Pandas在读取字符串时会默默忽略失败：
file=pd.read_csv('filename.csv', sep=';', encoding='utf-8')

必须添加encoding='utf-8'
以读取\u csv，因为python 2不默认为unicode字符串（字节字符串不能处理增量）。您什么也得不到，因为Pandas在读取字符串时会默默忽略失败：
file=pd.read_csv('filename.csv', sep=';', encoding='utf-8')

文件['column']
可能是U+0394的UTF-8编码，而不是Unicode代码点本身print“\xce\94”
将输出（终端允许）字符Δ，但“\xce\94”==u'\0394'
为假。文件['column']
可能是u+0394的UTF-8编码，而不是Unicode码点本身<代码>打印“\xce\94”
将输出（终端允许）字符Δ，但“\xce\94”==u'\0394'
为假。