Algorithm 从泛化的角度看渴望学习者与懒惰学习者

Algorithm 从泛化的角度看渴望学习者与懒惰学习者,algorithm,classification,data-mining,Algorithm,Classification,Data Mining,根据有关数据挖掘的书籍,懒惰的学习者在没有泛化步骤的情况下对对象进行分类 我需要知道的是,如果数据集的大小有限,且准确度非常重要,且误报率非常低,我们可以在创建模型所需的速度等方面折衷,那么最好是什么?懒惰学习者还是渴望学习者?假设数据集不是非常高维的。两者都可以用于此目的,例如,您可以使用KNN作为惰性学习者。如果低FP非常重要,您可以选择只有当KNN的所有k都被分类为真时,您才会被分类为真。@amit低FP确实很重要。由于数据集很小,因此每次创建新模型所需的时间较少。但随着数据集变得越来越大

根据有关数据挖掘的书籍,懒惰的学习者在没有泛化步骤的情况下对对象进行分类


我需要知道的是,如果数据集的大小有限,且准确度非常重要,且误报率非常低,我们可以在创建模型所需的速度等方面折衷,那么最好是什么?懒惰学习者还是渴望学习者?假设数据集不是非常高维的。

两者都可以用于此目的,例如,您可以使用KNN作为惰性学习者。如果低FP非常重要,您可以选择只有当KNN的所有k都被分类为真时,您才会被分类为真。@amit低FP确实很重要。由于数据集很小,因此每次创建新模型所需的时间较少。但随着数据集变得越来越大,应该选择什么?因为数据集可能会随着时间的推移而消失,甚至可能是其大小的两倍,因此旧模型将是不相关的。还有一种称为增量学习的方法。例如,决策树和决策林是热切的学习者,但以增量方式实现它们非常简单,因此您将获得的每个新示例都将添加到模型中,而无需重新计算。另外:培训时间是否是一个问题?如果数据集很小,那么学习时间预计也不会太长,就目前而言,我想说的是准确度要高得多。但如果需要基于web的实现,时间也将变得很重要。然后启发法就会发挥作用。