Machine learning 使用生成模型还是区分模型进行分类?

Machine learning 使用生成模型还是区分模型进行分类?,machine-learning,dataset,classification,generative,Machine Learning,Dataset,Classification,Generative,机器学习初学者在这里!我想了解我应该如何处理分类问题。考虑到目前的问题是分类一个对象是属于A类还是B类,我想知道我应该使用生成模型还是区分模型。我有两个问题 判别模型似乎在分类问题上做得更好,因为它只关心如何绘制决策边界,而不关心其他任何事情 问:然而,如果有一个大约80个a类对象和不到10个B类对象的小数据集需要训练和测试,那么鉴别模型是否会过度拟合,从而生成模型的性能会更好 此外,由于a类对象和B类对象的数量存在巨大差异,经过训练的模型可能只能拾取a类对象。即使模型将所有对象分类为A类,这仍

机器学习初学者在这里!我想了解我应该如何处理分类问题。考虑到目前的问题是分类一个对象是属于A类还是B类,我想知道我应该使用生成模型还是区分模型。我有两个问题

  • 判别模型似乎在分类问题上做得更好,因为它只关心如何绘制决策边界,而不关心其他任何事情 问:然而,如果有一个大约80个a类对象和不到10个B类对象的小数据集需要训练和测试,那么鉴别模型是否会过度拟合,从而生成模型的性能会更好

  • 此外,由于a类对象和B类对象的数量存在巨大差异,经过训练的模型可能只能拾取a类对象。即使模型将所有对象分类为A类,这仍然会导致非常高的精度分数
    问:考虑到没有其他方法可以增加B类数据集的大小,有没有关于如何减少这种偏见的想法

    这似乎更适合stats SE。为了处理不平衡的数据,您可以始终对较小的数据集进行过采样。过采样可以通过将A类对象复制8次来完成,也可以通过高级方法(如SMOTE)来完成!然后你可以尝试一个有区别的算法!