Machine learning 使用生成模型还是区分模型进行分类？_Machine Learning_Dataset_Classification_Generative

Machine learning 使用生成模型还是区分模型进行分类？

machine-learning

Machine learning 使用生成模型还是区分模型进行分类？,machine-learning,dataset,classification,generative,Machine Learning,Dataset,Classification,Generative,机器学习初学者在这里！我想了解我应该如何处理分类问题。考虑到目前的问题是分类一个对象是属于A类还是B类，我想知道我应该使用生成模型还是区分模型。我有两个问题判别模型似乎在分类问题上做得更好，因为它只关心如何绘制决策边界，而不关心其他任何事情问：然而，如果有一个大约80个a类对象和不到10个B类对象的小数据集需要训练和测试，那么鉴别模型是否会过度拟合，从而生成模型的性能会更好此外，由于a类对象和B类对象的数量存在巨大差异，经过训练的模型可能只能拾取a类对象。即使模型将所有对象分类为A类，这仍

机器学习初学者在这里！我想了解我应该如何处理分类问题。考虑到目前的问题是分类一个对象是属于A类还是B类，我想知道我应该使用生成模型还是区分模型。我有两个问题

判别模型似乎在分类问题上做得更好，因为它只关心如何绘制决策边界，而不关心其他任何事情问：然而，如果有一个大约80个a类对象和不到10个B类对象的小数据集需要训练和测试，那么鉴别模型是否会过度拟合，从而生成模型的性能会更好

此外，由于a类对象和B类对象的数量存在巨大差异，经过训练的模型可能只能拾取a类对象。即使模型将所有对象分类为A类，这仍然会导致非常高的精度分数

问：考虑到没有其他方法可以增加B类数据集的大小，有没有关于如何减少这种偏见的想法

这似乎更适合stats SE。为了处理不平衡的数据，您可以始终对较小的数据集进行过采样。过采样可以通过将A类对象复制8次来完成，也可以通过高级方法（如SMOTE）来完成！然后你可以尝试一个有区别的算法！