Python 如果特征数量增加,则在使用一个热编码后提高准确性

Python 如果特征数量增加,则在使用一个热编码后提高准确性,python,machine-learning,random-forest,Python,Machine Learning,Random Forest,我最初是通过合并所有数据文件来解决电信网络中断问题的。我有480多列,之后我做了一个热编码,我的列大约变成1568列。现在准确度不好。如何减少列数并提高准确性?我已经申请了PCA。因为问题中没有足够的信息;我要用可用的东西挖一挖。 有那么多栏目,;数据变得稀疏。尝试在分类器中使用L1正则化

我最初是通过合并所有数据文件来解决电信网络中断问题的。我有480多列,之后我做了一个热编码,我的列大约变成1568列。现在准确度不好。如何减少列数并提高准确性?我已经申请了PCA。

因为问题中没有足够的信息;我要用可用的东西挖一挖。 有那么多栏目,;数据变得稀疏。尝试在分类器中使用L1正则化