Scikit learn python/scikit中分类变量的插补

Scikit learn python/scikit中分类变量的插补,scikit-learn,Scikit Learn,我有一个csv文件,包含23列分类字符串变量,即性别、位置、技能集等 其中一些列缺少值。没有一列缺少超过20%的数据,因此我想对缺少的分类变量进行插补 这可能吗 我试过了 从sklearn_导入分类计算机 imputer=CategoricalImputer(strategy='most_frequent', axis=1) imputer.fit(df[["Permission", "Hope"]]) imputer.transform(df) 但我得到了这个错误: NameError:

我有一个csv文件,包含23列分类字符串变量,即性别、位置、技能集等

其中一些列缺少值。没有一列缺少超过20%的数据,因此我想对缺少的分类变量进行插补

这可能吗

我试过了 从sklearn_导入分类计算机

imputer=CategoricalImputer(strategy='most_frequent', axis=1)
imputer.fit(df[["Permission", "Hope"]])
imputer.transform(df)  
但我得到了这个错误: NameError:未定义名称“CategoricalComputer”

在进行插补之前,我是否需要将23列中的每一列热编码为整数?
或者是否有可能插补缺失的分类字符串变量?

categoricalComputer
仅在版本
0.20
中引入。所以用
pip-install-git更新+git://github.com/scikit-learn/scikit-learn.git
或检查github问题

分类计算机
仅在版本
0.20中引入。所以用
pip-install-git更新+git://github.com/scikit-learn/scikit-learn.git
或检查github问题

只需在控制台中打开python,然后键入sklearn。\版本\您应该更新到版本0.20。下面是运行pip-install-git+git://github.com/scikit-learn/scikit-learn.git
或选中此选项,只需在控制台中打开python,然后键入sklearn.\u版本\u您应该更新到版本0.20。下面是运行pip-install-git+git://github.com/scikit-learn/scikit-learn.git或检查此项