使用pandas/python导入文本_Python_Pandas

使用pandas/python导入文本

python pandas

使用pandas/python导入文本,python,pandas,Python,Pandas,我正在将一个包含一些文本的表导入到一个数据框中。其中一个字符串包含文本“NF-κB”-即“κ”字符（表中的一些文本还包含字母和β等）当我在表格中阅读时，使用： pd.read_table('table_processed.txt', sep='\t') kappa字符被转换为“\xce\xba”，因此在iPython中查看时，字符串的一部分现在将读取“NF-\xce\xbaB” 当字符串被视为数据帧的一部分时，是否有任何方法在导入期间维护字符串编码以维护kappa字符提前感谢直接从文档中获

我正在将一个包含一些文本的表导入到一个数据框中。其中一个字符串包含文本“NF-κB”-即“κ”字符（表中的一些文本还包含字母和β等）

当我在表格中阅读时，使用：

pd.read_table('table_processed.txt', sep='\t')

kappa字符被转换为“\xce\xba”，因此在iPython中查看时，字符串的一部分现在将读取“NF-\xce\xbaB”

当字符串被视为数据帧的一部分时，是否有任何方法在导入期间维护字符串编码以维护kappa字符

提前感谢

直接从文档中获取，请尝试使用编码

直接从文档中，尝试使用编码

In [1079]: data = 'word,length\nTr\xe4umen,7\nGr\xfc\xdfe,5'

In [1080]: df = pd.read_csv(StringIO(data), encoding='latin-1')

In [1081]: df

      word  length
0  Träumen       7
1    Grüße       5

In [1082]: df['word'][1]
u'Gr\xfc\xdfe'