Machine learning 在分类方法中减少类是否可以提高准确性?

Machine learning 在分类方法中减少类是否可以提高准确性?,machine-learning,Machine Learning,我很想知道,对于多类分类,减少监督分类模型(特别是逻辑回归)中的类数是否能显著提高准确性。例如,如果我有50个类用于10000个样本,我通过将某些类组合在一起将类的数量减少到30个。这会显著提高我的分类模型的准确性吗?如果您组合的类相似,并且它们之间有大量的样本分类错误,那么肯定会提高您的性能,因为这会减少错误 例如: 假设您正在对4个不同类别(猫、狗、椅子、桌子)的样本进行分类 如果您将这些类别分组,并执行动物分类与非动物分类,那么当猫被错误分类为狗(以及viceversa)时发生的所有分类

我很想知道,对于多类分类,减少监督分类模型(特别是逻辑回归)中的类数是否能显著提高准确性。例如,如果我有50个类用于10000个样本,我通过将某些类组合在一起将类的数量减少到30个。这会显著提高我的分类模型的准确性吗?

如果您组合的类相似,并且它们之间有大量的样本分类错误,那么肯定会提高您的性能,因为这会减少错误

例如:

  • 假设您正在对4个不同类别(猫、狗、椅子、桌子)的样本进行分类
  • 如果您将这些类别分组,并执行动物分类与非动物分类,那么当猫被错误分类为狗(以及viceversa)时发生的所有分类错误将不再发生,您的总体准确性将提高

如果您分组的类不相似,那么很可能不会提高您的准确性,因为您不会减少错误的数量。假设您的分类器非常好,您不会将任何猫误认为是狗,反之亦然。在组合这些类时,您不会减少任何错误,因为没有。减少类数的效果取决于算法和数据集。一般来说,不能保证减少类的数量会提高分类精度。在许多情况下,情况正好相反——增加类的数量可以提高分类精度


例如,对于许多数据集,您可以使每个观察对应于一个唯一的类,并最终达到100%的分类精度。这是一个明显的过度拟合的例子,但实际上增加(而不是减少)类的数量有时可以提高分类精度

事物的分类是一个广泛的话题。有太多不同的分类方法,你的问题无法得到正确的回答。@Carsten我要一个有监督的分类模型(多类分类)和逻辑回归模型。我实际上已经尝试过减少话题,但是从50到45到41,我只注意到增加的小数点差异。所以我突然想到了这个问题。也许可以把这个信息放在你的问题里?:)