Machine learning 对于不平衡数据,要预测哪一类?

Machine learning 对于不平衡数据,要预测哪一类?,machine-learning,binary,classification,prediction,Machine Learning,Binary,Classification,Prediction,对于具有不平衡类的机器学习二元分类问题,哪个类被认为是正类重要吗?所以,如果A类是多数阶级,按照惯例,我想预测它还是少数阶级B?这很重要吗?事实上,这并不重要,但这取决于你的潜在问题。例如,如果你想对一项医学测试进行分类,其中阳性对应于“存在疾病”,并且我们假设阳性样本是少数,那么你可能想预测一个人患病/属于少数的概率有多高 谢谢你的回复!如果没有明确的“是”或“否”,情况如何?例如:疾病存在/不存在,注射/未注射,健康/不健康。我脑海中不一定有一个例子,但是如果没有层次或结构,只有A组和B组,

对于具有不平衡类的机器学习二元分类问题,哪个类被认为是正类重要吗?所以,如果A类是多数阶级,按照惯例,我想预测它还是少数阶级B?这很重要吗?

事实上,这并不重要,但这取决于你的潜在问题。例如,如果你想对一项医学测试进行分类,其中阳性对应于“存在疾病”,并且我们假设阳性样本是少数,那么你可能想预测一个人患病/属于少数的概率有多高

谢谢你的回复!如果没有明确的“是”或“否”,情况如何?例如:疾病存在/不存在,注射/未注射,健康/不健康。我脑海中不一定有一个例子,但是如果没有层次或结构,只有A组和B组,你会倾向于大多数人吗?如果你只有A组和B组,这完全取决于你。一般来说,少数族裔更难预测,因此更有趣。我建议你阅读《从He等人2009年的不平衡数据中学习》这篇论文,它对这个主题有很好的见解。