Machine learning 在分类方法中减少类是否可以提高准确性？_Machine Learning

Machine learning 在分类方法中减少类是否可以提高准确性？

machine-learning

Machine learning 在分类方法中减少类是否可以提高准确性？,machine-learning,Machine Learning,我很想知道，对于多类分类，减少监督分类模型（特别是逻辑回归）中的类数是否能显著提高准确性。例如，如果我有50个类用于10000个样本，我通过将某些类组合在一起将类的数量减少到30个。这会显著提高我的分类模型的准确性吗？如果您组合的类相似，并且它们之间有大量的样本分类错误，那么肯定会提高您的性能，因为这会减少错误例如：假设您正在对4个不同类别（猫、狗、椅子、桌子）的样本进行分类如果您将这些类别分组，并执行动物分类与非动物分类，那么当猫被错误分类为狗（以及viceversa）时发生的所有分类

我很想知道，对于多类分类，减少监督分类模型（特别是逻辑回归）中的类数是否能显著提高准确性。例如，如果我有50个类用于10000个样本，我通过将某些类组合在一起将类的数量减少到30个。这会显著提高我的分类模型的准确性吗？

如果您组合的类相似，并且它们之间有大量的样本分类错误，那么肯定会提高您的性能，因为这会减少错误

例如：

假设您正在对4个不同类别（猫、狗、椅子、桌子）的样本进行分类
如果您将这些类别分组，并执行动物分类与非动物分类，那么当猫被错误分类为狗（以及viceversa）时发生的所有分类错误将不再发生，您的总体准确性将提高

如果您分组的类不相似，那么很可能不会提高您的准确性，因为您不会减少错误的数量。假设您的分类器非常好，您不会将任何猫误认为是狗，反之亦然。在组合这些类时，您不会减少任何错误，因为没有。减少类数的效果取决于算法和数据集。一般来说，不能保证减少类的数量会提高分类精度。在许多情况下，情况正好相反——增加类的数量可以提高分类精度

例如，对于许多数据集，您可以使每个观察对应于一个唯一的类，并最终达到100%的分类精度。这是一个明显的过度拟合的例子，但实际上增加（而不是减少）类的数量有时可以提高分类精度

事物的分类是一个广泛的话题。有太多不同的分类方法，你的问题无法得到正确的回答。@Carsten我要一个有监督的分类模型（多类分类）和逻辑回归模型。我实际上已经尝试过减少话题，但是从50到45到41，我只注意到增加的小数点差异。所以我突然想到了这个问题。也许可以把这个信息放在你的问题里？：）