Python 从CSV读取数据帧时断开的韩语字符串

Python 从CSV读取数据帧时断开的韩语字符串,python,unicode,pandas,Python,Unicode,Pandas,我是韩国用户 当我从Pandas数据帧读取.csv文件时,韩语字符串如下所示:����� 英语很好 输入数据样本: Unnamed: 0 �������� �������ε����� ��X��ǥ ��Y��ǥ �����ڵ� ������ ����߻��������� ����Ǽ� �������� 0 165244 20131201 �ٻ�62175541 962170 1955410 331 �������� 1 2 18224.03

我是韩国用户

当我从Pandas数据帧读取.csv文件时,韩语字符串如下所示:�����

英语很好

输入数据样本:

Unnamed: 0  ��������    �������ε�����   ��X��ǥ  ��Y��ǥ  �����ڵ� ������  ����߻���������  ����Ǽ�  ��������

0   165244  20131201    �ٻ�62175541 962170  1955410 331 ��������    1   2   18224.03

为什么韩文文本会损坏?

您的文本格式是unicode,因此需要将其解码为utf-8:


您的.csv文件的编码是什么?是否使用utf8或其他编码保存?我是ipython用户。我使用这个代码。但我注意到了这个错误——UnicodeDecodeError:“utf8”编解码器无法解码位置0处的字节0xc7:无效的延续字节,请使用ISO-8859-1更改utf-8并给出结果!
import csv
def unicode_reader('your_file_name',delimiter='your_delimiter', **kwargs):
     spamreader = csv.reader('your_file_name',delimiter='your_delimiter', **kwargs)
     for row in spamreader:
        yield [unicode(w, 'utf-8') for w in row]

reader = unicode_csv_reader(open('your_file_name'))
for tex in reader:
  print tex