Python 从CSV读取数据帧时断开的韩语字符串
我是韩国用户 当我从Pandas数据帧读取.csv文件时,韩语字符串如下所示:����� 英语很好 输入数据样本:Python 从CSV读取数据帧时断开的韩语字符串,python,unicode,pandas,Python,Unicode,Pandas,我是韩国用户 当我从Pandas数据帧读取.csv文件时,韩语字符串如下所示:����� 英语很好 输入数据样本: Unnamed: 0 �������� �������ε����� ��X��ǥ ��Y��ǥ �����ڵ� ������ ������������� ����Ǽ� �������� 0 165244 20131201 �ٻ�62175541 962170 1955410 331 �������� 1 2 18224.03
Unnamed: 0 �������� �������ε����� ��X��ǥ ��Y��ǥ �����ڵ� ������ ������������� ����Ǽ� ��������
0 165244 20131201 �ٻ�62175541 962170 1955410 331 �������� 1 2 18224.03
为什么韩文文本会损坏?您的文本格式是unicode,因此需要将其解码为utf-8:
您的.csv文件的编码是什么?是否使用utf8或其他编码保存?我是ipython用户。我使用这个代码。但我注意到了这个错误——UnicodeDecodeError:“utf8”编解码器无法解码位置0处的字节0xc7:无效的延续字节,请使用ISO-8859-1更改utf-8并给出结果!
import csv
def unicode_reader('your_file_name',delimiter='your_delimiter', **kwargs):
spamreader = csv.reader('your_file_name',delimiter='your_delimiter', **kwargs)
for row in spamreader:
yield [unicode(w, 'utf-8') for w in row]
reader = unicode_csv_reader(open('your_file_name'))
for tex in reader:
print tex