Python 从CSV读取数据帧时断开的韩语字符串_Python_Unicode_Pandas

Python 从CSV读取数据帧时断开的韩语字符串

python unicode pandas

Python 从CSV读取数据帧时断开的韩语字符串,python,unicode,pandas,Python,Unicode,Pandas,我是韩国用户当我从Pandas数据帧读取.csv文件时，韩语字符串如下所示：�� 英语很好输入数据样本： Unnamed: 0 �� ε�� X��ǥ ��Y��ǥ ��ڵ� �� ߻�� Ǽ� �� 0 165244 20131201 �ٻ�62175541 962170 1955410 331 �� 1 2 18224.03

我是韩国用户

当我从Pandas数据帧读取.csv文件时，韩语字符串如下所示：��

英语很好

输入数据样本：

Unnamed: 0  ��������    �������ε�����   ��X��ǥ  ��Y��ǥ  �����ڵ� ������  ����߻���������  ����Ǽ�  ��������

0   165244  20131201    �ٻ�62175541 962170  1955410 331 ��������    1   2   18224.03

为什么韩文文本会损坏？

您的文本格式是unicode，因此需要将其解码为utf-8：

您的.csv文件的编码是什么？是否使用utf8或其他编码保存？我是ipython用户。我使用这个代码。但我注意到了这个错误——UnicodeDecodeError:“utf8”编解码器无法解码位置0处的字节0xc7：无效的延续字节，请使用ISO-8859-1更改utf-8并给出结果！

import csv
def unicode_reader('your_file_name',delimiter='your_delimiter', **kwargs):
     spamreader = csv.reader('your_file_name',delimiter='your_delimiter', **kwargs)
     for row in spamreader:
        yield [unicode(w, 'utf-8') for w in row]

reader = unicode_csv_reader(open('your_file_name'))
for tex in reader:
  print tex