Python 我应该使用一个热编码的特征选择吗?
我有一个两难的选择,我正在使用一个热编码,我需要做特征选择(对于分类和数字特征),我有一些并不重要的特征,但我不想使用一些算法来做,而不是手动。我的问题有两个方面-Python 我应该使用一个热编码的特征选择吗?,python,scikit-learn,feature-selection,one-hot-encoding,Python,Scikit Learn,Feature Selection,One Hot Encoding,我有一个两难的选择,我正在使用一个热编码,我需要做特征选择(对于分类和数字特征),我有一些并不重要的特征,但我不想使用一些算法来做,而不是手动。我的问题有两个方面- 我可以使用什么特征选择技术来完成它 我是在一次热编码之后还是之前做的 如果您有许多功能,并且其中许多功能可能与模型无关,则功能选择将允许您放弃这些功能,并将数据集限制为最相关的功能 在这些情况下,贝娄是一个需要考虑的几个重要方面: 维度诅咒 在处理大型数据集时,这通常是非常关键的一步。例如,盲目地对所有分类特征进行热编码,可能
- 我可以使用什么特征选择技术来完成它
- 我是在一次热编码之后还是之前做的
- 维度诅咒
- 特征重要性
根据一些评论
- 我应该用贴标机吗
- 我应该如何处理高基数特性