Machine learning 根据分类特征的值频率选择分类特征

Machine learning 根据分类特征的值频率选择分类特征,machine-learning,Machine Learning,我正在进行基本的机器学习线性回归模型创建。 我有一些分类特征,有点像 AllPub 1459 NoSeWa 1 Name: Utilities, dtype: int64 大家可以看到,AllPub是贡献更多的一家。那么它在模型创建中有用吗?我是否应该使用它???正如您所看到的,大多数值都是AllPub,只有一个值是NoSeWa。如果你保留或删除,不会有多大区别。 另一种思考方式可能是异常值。由于只有一个计数,因此可能输入错误。您可以使用mode输入该值

我正在进行基本的机器学习线性回归模型创建。 我有一些分类特征,有点像

AllPub    1459
NoSeWa       1
Name: Utilities, dtype: int64

大家可以看到,AllPub是贡献更多的一家。那么它在模型创建中有用吗?我是否应该使用它???

正如您所看到的,大多数值都是AllPub,只有一个值是NoSeWa。如果你保留或删除,不会有多大区别。 另一种思考方式可能是异常值。由于只有一个计数,因此可能输入错误。您可以使用mode输入该值