Machine learning 当我使用更多变量时,ROC曲线下面积(AUC)为什么会减少?

Machine learning 当我使用更多变量时,ROC曲线下面积(AUC)为什么会减少?,machine-learning,neural-network,matlab,roc,Machine Learning,Neural Network,Matlab,Roc,我的数据集有100个特征的400个观测值。400个观测值中的每一个都属于2类中的1类 我正在MATLAB中训练一个神经网络()来对这个数据集进行分类。 我不会一次使用所有的特性,但首先我使用一个特性(400x1),然后添加第二个特性(400x2),以此类推。在每一步中,我都使用以下公式计算AUC 我的问题是: AUC在变化,但并不总是随着每次额外输入而变大。 当我使用更多的功能来训练网络时,AUC不应该增加吗?(我总是使用相同的分区) 感谢所有的评论和帮助!谢谢 也许第一个特征更具辨别力,而最后

我的数据集有100个特征的400个观测值。400个观测值中的每一个都属于2类中的1类

我正在MATLAB中训练一个神经网络()来对这个数据集进行分类。
我不会一次使用所有的特性,但首先我使用一个特性(400x1),然后添加第二个特性(400x2),以此类推。在每一步中,我都使用以下公式计算AUC

我的问题是:

AUC在变化,但并不总是随着每次额外输入而变大。
当我使用更多的功能来训练网络时,AUC不应该增加吗?(我总是使用相同的分区)


感谢所有的评论和帮助!谢谢

也许第一个特征更具辨别力,而最后一个特征只会增加噪音!您可以尝试运行一个随机林,看看哪些特征在类别之间最有区别

查看您生成的ROC曲线以及网络结构会很有帮助。更好的是,你可以发布你使用的代码。也许第一个功能更具辨别力,而最后一个功能只会增加噪音!您可以尝试运行一个随机林,看看哪些特性是最有区别的categories@bendaizer你说得对,第一个是最有鉴别力的!我所拥有的功能,是根据它们在不同类别之间的分布差异预先订购的。@bogatron很抱歉花了这么多时间来回答,我已经更改了几个月的项目。尽管如此,发布所有ROC曲线还是很困难的,因为MATLAB为每个附加功能提供了四个ROC曲线图,所以它们大约有400个曲线图。所以,我不知道为什么,但我无法对您的评论进行投票。。。