Scikit learn python/scikit中分类变量的插补_Scikit Learn

Scikit learn python/scikit中分类变量的插补

scikit-learn

Scikit learn python/scikit中分类变量的插补,scikit-learn,Scikit Learn,我有一个csv文件，包含23列分类字符串变量，即性别、位置、技能集等其中一些列缺少值。没有一列缺少超过20%的数据，因此我想对缺少的分类变量进行插补这可能吗我试过了从sklearn_导入分类计算机 imputer=CategoricalImputer(strategy='most_frequent', axis=1) imputer.fit(df[["Permission", "Hope"]]) imputer.transform(df) 但我得到了这个错误： NameError:

我有一个csv文件，包含23列分类字符串变量，即性别、位置、技能集等

其中一些列缺少值。没有一列缺少超过20%的数据，因此我想对缺少的分类变量进行插补

这可能吗

我试过了从sklearn_导入分类计算机

imputer=CategoricalImputer(strategy='most_frequent', axis=1)
imputer.fit(df[["Permission", "Hope"]])
imputer.transform(df)

但我得到了这个错误： NameError:未定义名称“CategoricalComputer”

在进行插补之前，我是否需要将23列中的每一列热编码为整数？

或者是否有可能插补缺失的分类字符串变量？

categoricalComputer

仅在版本

0.20

中引入。所以用

pip-install-git更新+git://github.com/scikit-learn/scikit-learn.git

或检查github问题

分类计算机

仅在版本

0.20中引入。所以用pip-install-git更新+git://github.com/scikit-learn/scikit-learn.git
或检查github问题
只需在控制台中打开python，然后键入sklearn。\版本\您应该更新到版本0.20。下面是运行pip-install-git+git://github.com/scikit-learn/scikit-learn.git

或选中此选项，只需在控制台中打开python，然后键入sklearn.\u版本\u您应该更新到版本0.20。下面是运行pip-install-git+git://github.com/scikit-learn/scikit-learn.git或检查此项