Python 将值中的对象数据类型转换为浮点数据类型

Python 将值中的对象数据类型转换为浮点数据类型,python,pandas,scikit-learn,Python,Pandas,Scikit Learn,我正在对Ecoli数据集进行分类,作为一项任务 数据集从UCI存储库中收集。要创建决策树分类器,我需要将对象数据类型转换为float。将数据类型转换为float时,列中的字符串将全部更改为“NaN” 所以我不能在fit()函数中使用该列 那么输出是这样的 尝试将序列转换为数字,并在被告知时强制执行 errors='compresse'将把它能转换的任何东西转换成float,不能转换的任何东西转换成NaNs 如果您想将无法转换为float的内容保留在 调试的原始表单,执行errors='igno

我正在对Ecoli数据集进行分类,作为一项任务 数据集从UCI存储库中收集。要创建决策树分类器,我需要将对象数据类型转换为float。将数据类型转换为float时,列中的字符串将全部更改为“NaN” 所以我不能在fit()函数中使用该列

那么输出是这样的

尝试将序列转换为数字,并在被告知时强制执行

  • errors='compresse'
    将把它能转换的任何东西转换成
    float
    ,不能转换的任何东西转换成
    NaN
    s
  • 如果您想将无法转换为
    float
    的内容保留在 调试的原始表单,执行
    errors='ignore'
另外,你能把原始数据放在蛋白质序列栏吗?也许,在转换之前稍微清洗一下会有所帮助

data_file = pd.read_csv('/home/root-user/Documents/ecoli.csv')
df1 = pd.DataFrame(data_file)
df1_cleaned = df1.drop('SEQUENCE_NAME',axis=1)
df1_cleaned['PROTEIN_SEQUENCE'] = pd.to_numeric(df1_cleaned['PROTEIN_SEQUENCE'], errors='coerce')
cleaned_list = df1_cleaned.values.tolist()
print(df1_cleaned)