Matlab 在任一特征集上的分类是好的,但在组合特征集上的分类是坏的

Matlab 在任一特征集上的分类是好的,但在组合特征集上的分类是坏的,matlab,machine-learning,feature-extraction,Matlab,Machine Learning,Feature Extraction,我有两个要素集:f1和f2。数据量为140万。仅使用f1,我训练了随机林并在测试集上进行测试。准确率为79%。然后我只使用f2,并在同一测试集上进行测试。准确率为79.5%。然而,当我将f1和f2合并为一个特征向量并运行相同的实验时。准确度为80.4% 然后我做了这个测试。我首先只使用f1和训练的随机森林,并在测试集上进行测试。我收集了一些我无法正确分类的数据,称为S1。然后,我只使用f2并将收集的数据集S1拆分为训练集和测试集。该测试集的准确度为86% 根据我的实验结果,谁能告诉我出了什么问题

我有两个要素集:f1和f2。数据量为140万。仅使用f1,我训练了随机林并在测试集上进行测试。准确率为79%。然后我只使用f2,并在同一测试集上进行测试。准确率为79.5%。然而,当我将f1和f2合并为一个特征向量并运行相同的实验时。准确度为80.4%

然后我做了这个测试。我首先只使用f1和训练的随机森林,并在测试集上进行测试。我收集了一些我无法正确分类的数据,称为S1。然后,我只使用f2并将收集的数据集S1拆分为训练集和测试集。该测试集的准确度为86%


根据我的实验结果,谁能告诉我出了什么问题?为什么合并要素集f1和f2时精度较低

可能存在过度拟合(方差)。我建议您尝试在F1F2上运行特征选择算法,以从F1和F2中获取特征子集。您可以在中阅读更多有关该主题的信息

第4课描述偏差与方差,第5课描述模型选择,包括特征选择。
YouTube上还有cs229的视频讲座,coursera上还有另一个版本。

准确率不低,比使用单个功能集高约1%。此外,在S1上,您仅获得86%的准确率,这仅比使用f1高7%。那么如果你取79和86的加权平均值,它是否接近80-81%?(假设S1的数据量较少)。