Machine learning 在交叉验证精度为0的二元分类器中,特征选择方法给出的特征意味着什么?

Machine learning 在交叉验证精度为0的二元分类器中,特征选择方法给出的特征意味着什么?,machine-learning,classification,feature-selection,Machine Learning,Classification,Feature Selection,所以我知道给定一个二元分类器,你离精度0.5越远,你的分类器就越好。(也就是说,如果一个二元分类器的判断总是错误的,那么它就可以被转换成一个通过总是颠倒它的判断来判断一切都正确的二元分类器。) 然而,我有一个内部特征选择过程,它为我提供了“好”的特征来使用(我正在尝试递归特征消除,另一个基于斯皮尔曼的秩相关系数)。考虑到使用这些“良好”特征的分类器的交叉验证精度为0,我是否仍然可以得出结论,所选特征是有用的,并且可以预测这个二进制预测问题中的类?为了简化,让我们假设您正在某个平衡集上进行测试。一

所以我知道给定一个二元分类器,你离精度0.5越远,你的分类器就越好。(也就是说,如果一个二元分类器的判断总是错误的,那么它就可以被转换成一个通过总是颠倒它的判断来判断一切都正确的二元分类器。)


然而,我有一个内部特征选择过程,它为我提供了“好”的特征来使用(我正在尝试递归特征消除,另一个基于斯皮尔曼的秩相关系数)。考虑到使用这些“良好”特征的分类器的交叉验证精度为0,我是否仍然可以得出结论,所选特征是有用的,并且可以预测这个二进制预测问题中的类?

为了简化,让我们假设您正在某个平衡集上进行测试。一半测试数据为正,一半测试数据为负

我想说的是,一些奇怪的事情正在发生,它正在改变你的决定。您正在评估的分类器非常有用,但您需要改变它所做的决定。您可能应该检查代码,以确保没有翻转训练数据的类。一些库(例如LIBSVM)要求第一个训练示例来自正数类

总而言之:您选择的功能似乎很有用,但您似乎有一个bug正在翻转类