Python 从文件中读取希腊字母
我有一个.csv文件,其中包含一定数量的列。其中一列有几个值,称为Python 从文件中读取希腊字母,python,python-2.7,unicode,Python,Python 2.7,Unicode,我有一个.csv文件,其中包含一定数量的列。其中一列有几个值,称为Δ(希腊字母Delta) 我试着打印这封信,我成功了: print u'\u0394' 正确返回希腊字母 但是,如果我尝试在名为'column'的列中选择包含Δ的文件行,请使用 file=pd.read_csv('filename.csv',sep=';') print file[file['column']==u'\u0394'] 我发现自己的列表是空的,尽管我知道某些行在该列中确实有Δ 我做错了什么?您必须添加encod
Δ
(希腊字母Delta)
我试着打印这封信,我成功了:
print u'\u0394'
正确返回希腊字母
但是,如果我尝试在名为'column'
的列中选择包含Δ的文件行,请使用
file=pd.read_csv('filename.csv',sep=';')
print file[file['column']==u'\u0394']
我发现自己的列表是空的,尽管我知道某些行在该列中确实有Δ
我做错了什么?您必须添加encoding='utf-8'
来读取\u csv,因为python 2不默认为unicode字符串(字节字符串不能处理增量)。您什么也得不到,因为Pandas在读取字符串时会默默忽略失败:
file=pd.read_csv('filename.csv', sep=';', encoding='utf-8')
必须添加encoding='utf-8'
以读取\u csv,因为python 2不默认为unicode字符串(字节字符串不能处理增量)。您什么也得不到,因为Pandas在读取字符串时会默默忽略失败:
file=pd.read_csv('filename.csv', sep=';', encoding='utf-8')
文件['column']
可能是U+0394的UTF-8编码,而不是Unicode代码点本身print“\xce\94”
将输出(终端允许)字符Δ,但“\xce\94”==u'\0394'
为假。文件['column']
可能是u+0394的UTF-8编码,而不是Unicode码点本身<代码>打印“\xce\94”
将输出(终端允许)字符Δ,但“\xce\94”==u'\0394'
为假。