Scikit learn python/scikit中分类变量的插补
我有一个csv文件,包含23列分类字符串变量,即性别、位置、技能集等 其中一些列缺少值。没有一列缺少超过20%的数据,因此我想对缺少的分类变量进行插补 这可能吗 我试过了 从sklearn_导入分类计算机Scikit learn python/scikit中分类变量的插补,scikit-learn,Scikit Learn,我有一个csv文件,包含23列分类字符串变量,即性别、位置、技能集等 其中一些列缺少值。没有一列缺少超过20%的数据,因此我想对缺少的分类变量进行插补 这可能吗 我试过了 从sklearn_导入分类计算机 imputer=CategoricalImputer(strategy='most_frequent', axis=1) imputer.fit(df[["Permission", "Hope"]]) imputer.transform(df) 但我得到了这个错误: NameError:
imputer=CategoricalImputer(strategy='most_frequent', axis=1)
imputer.fit(df[["Permission", "Hope"]])
imputer.transform(df)
但我得到了这个错误:
NameError:未定义名称“CategoricalComputer”
在进行插补之前,我是否需要将23列中的每一列热编码为整数?
或者是否有可能插补缺失的分类字符串变量?
categoricalComputer
仅在版本0.20
中引入。所以用pip-install-git更新+git://github.com/scikit-learn/scikit-learn.git
或检查github问题分类计算机
仅在版本0.20中引入。所以用pip-install-git更新+git://github.com/scikit-learn/scikit-learn.git
或检查github问题只需在控制台中打开python,然后键入sklearn。\版本\您应该更新到版本0.20。下面是运行pip-install-git+git://github.com/scikit-learn/scikit-learn.git
或选中此选项,只需在控制台中打开python,然后键入sklearn.\u版本\u您应该更新到版本0.20。下面是运行pip-install-git+git://github.com/scikit-learn/scikit-learn.git或检查此项