使用pandas/python导入文本

使用pandas/python导入文本,python,pandas,Python,Pandas,我正在将一个包含一些文本的表导入到一个数据框中。其中一个字符串包含文本“NF-κB”-即“κ”字符(表中的一些文本还包含字母和β等) 当我在表格中阅读时,使用: pd.read_table('table_processed.txt', sep='\t') kappa字符被转换为“\xce\xba”,因此在iPython中查看时,字符串的一部分现在将读取“NF-\xce\xbaB” 当字符串被视为数据帧的一部分时,是否有任何方法在导入期间维护字符串编码以维护kappa字符 提前感谢直接从文档中获

我正在将一个包含一些文本的表导入到一个数据框中。其中一个字符串包含文本“NF-κB”-即“κ”字符(表中的一些文本还包含字母和β等)

当我在表格中阅读时,使用:

pd.read_table('table_processed.txt', sep='\t')
kappa字符被转换为“\xce\xba”,因此在iPython中查看时,字符串的一部分现在将读取“NF-\xce\xbaB”

当字符串被视为数据帧的一部分时,是否有任何方法在导入期间维护字符串编码以维护kappa字符


提前感谢

直接从文档中获取,请尝试使用编码


直接从文档中,尝试使用编码

In [1079]: data = 'word,length\nTr\xe4umen,7\nGr\xfc\xdfe,5'

In [1080]: df = pd.read_csv(StringIO(data), encoding='latin-1')

In [1081]: df

      word  length
0  Träumen       7
1    Grüße       5

In [1082]: df['word'][1]
u'Gr\xfc\xdfe'