当arff加载到Python中时,字母出现在数据中

当arff加载到Python中时,字母出现在数据中,python,pandas,weka,arff,Python,Pandas,Weka,Arff,我已使用以下代码将arff文件加载到python: import pandas as pd, scipy as sp from scipy.io import arff datos,meta = arff.loadarff(open('selectividad.arff', 'r')) d = pd.DataFrame(datos) 当我使用head函数查看数据帧时,它的外观如下: 但是,这些“b”在arff文件中不存在,如下所示: 这里有什么问题?非常感谢对于一列,请应用以下代码: dat

我已使用以下代码将arff文件加载到python:

import pandas as pd, scipy as sp
from scipy.io import arff
datos,meta = arff.loadarff(open('selectividad.arff', 'r'))
d = pd.DataFrame(datos)
当我使用head函数查看数据帧时,它的外观如下:

但是,这些“b”在arff文件中不存在,如下所示:
这里有什么问题?非常感谢

对于一列,请应用以下代码:

data['name_column'] = data['name_column'].str.decode('utf-8') 
对于数据帧,应用: str_df=df。选择数据类型([np.object])
str_df=str_df.stack().str.decode('utf-8').unstack()

那些
b
是python显示
字节数组的方式,并且不是数据的一部分。那些
b
表示您正在处理一个字节字符串,而不是一个八位字节序列,这是ASCII字符。例如,您可以使用
.decode(“utf-8”)
对它们进行解码。欢迎使用堆栈溢出。请给答案加上解释。它如何解决这个问题?当做