Algorithm 从泛化的角度看渴望学习者与懒惰学习者_Algorithm_Classification_Data Mining

Algorithm 从泛化的角度看渴望学习者与懒惰学习者

algorithm

Algorithm 从泛化的角度看渴望学习者与懒惰学习者,algorithm,classification,data-mining,Algorithm,Classification,Data Mining,根据有关数据挖掘的书籍，懒惰的学习者在没有泛化步骤的情况下对对象进行分类我需要知道的是，如果数据集的大小有限，且准确度非常重要，且误报率非常低，我们可以在创建模型所需的速度等方面折衷，那么最好是什么？懒惰学习者还是渴望学习者？假设数据集不是非常高维的。两者都可以用于此目的，例如，您可以使用KNN作为惰性学习者。如果低FP非常重要，您可以选择只有当KNN的所有k都被分类为真时，您才会被分类为真。@amit低FP确实很重要。由于数据集很小，因此每次创建新模型所需的时间较少。但随着数据集变得越来越大

根据有关数据挖掘的书籍，懒惰的学习者在没有泛化步骤的情况下对对象进行分类

我需要知道的是，如果数据集的大小有限，且准确度非常重要，且误报率非常低，我们可以在创建模型所需的速度等方面折衷，那么最好是什么？懒惰学习者还是渴望学习者？假设数据集不是非常高维的。

两者都可以用于此目的，例如，您可以使用KNN作为惰性学习者。如果低FP非常重要，您可以选择只有当KNN的所有k都被分类为真时，您才会被分类为真。@amit低FP确实很重要。由于数据集很小，因此每次创建新模型所需的时间较少。但随着数据集变得越来越大，应该选择什么？因为数据集可能会随着时间的推移而消失，甚至可能是其大小的两倍，因此旧模型将是不相关的。还有一种称为增量学习的方法。例如，决策树和决策林是热切的学习者，但以增量方式实现它们非常简单，因此您将获得的每个新示例都将添加到模型中，而无需重新计算。另外：培训时间是否是一个问题？如果数据集很小，那么学习时间预计也不会太长，就目前而言，我想说的是准确度要高得多。但如果需要基于web的实现，时间也将变得很重要。然后启发法就会发挥作用。