Image processing 分类中的交叉验证

Image processing 分类中的交叉验证,image-processing,classification,cross-validation,Image Processing,Classification,Cross Validation,我有两个不同的数据集,数据集X和数据集Y。。。我从中计算用于分类的特征 案例1。当我将两者合并为一个大数据集,然后使用10倍交叉验证时,我得到了非常好的分类结果,准确率和AUC>95% 案例2。然而,如果我使用其中一个数据集进行训练,另一个用于测试,结果会严重下降,精确度和AUC都会变为约50% 我的问题是: 哪些案例的结果更可靠 为什么结果会有如此巨大的差异 谢谢。数据集的获取方式可能存在偏差,这会使您得到最差的结果 阅读 另一件事是,在一个案例中,您使用较小的数据集来训练分类器(假设两个数据

我有两个不同的数据集,数据集X和数据集Y。。。我从中计算用于分类的特征

案例1。当我将两者合并为一个大数据集,然后使用10倍交叉验证时,我得到了非常好的分类结果,准确率和AUC>95%

案例2。然而,如果我使用其中一个数据集进行训练,另一个用于测试,结果会严重下降,精确度和AUC都会变为约50%

我的问题是:

  • 哪些案例的结果更可靠

  • 为什么结果会有如此巨大的差异


  • 谢谢。

    数据集的获取方式可能存在偏差,这会使您得到最差的结果

    阅读

    另一件事是,在一个案例中,您使用较小的数据集来训练分类器(假设两个数据集的大小大致相同,即使使用10倍的交叉验证,两者的组合也会更大)。这必然会导致较差的性能

    因此,我的答案是:

  • 取决于您如何获得这两个数据集以及最终分类器的使用方式

  • 训练集的大小差异偏差如何获得


  • 我回答你的问题了吗?你需要额外的帮助吗?