Machine learning 如何在sklearn的集成分类器中使用自定义分类器?

Machine learning 如何在sklearn的集成分类器中使用自定义分类器?,machine-learning,nlp,scikits,scikit-learn,Machine Learning,Nlp,Scikits,Scikit Learn,我了解到sklearn中的内置集成方法使用决策树作为基本分类器。是否可以改用自定义分类器?如果您指的是随机林类,则不可以,这目前不可能。允许其他估计器的选项在去年1月的scikit learn邮件列表中讨论过,但我不相信有任何实际的代码出现在讨论中。我不知道这是否有帮助,但您可以使用管道实用程序非常轻松地堆叠/组合自定义分类器:如果您使用sklearn.emble.AdaBoostClassifier,那么答案是肯定的: 您可以自己指定基估计量。管道不是集成方法。他们只将单个分类器与一系列预处理

我了解到sklearn中的内置集成方法使用决策树作为基本分类器。是否可以改用自定义分类器?

如果您指的是随机林类,则不可以,这目前不可能。允许其他估计器的选项在去年1月的scikit learn邮件列表中讨论过,但我不相信有任何实际的代码出现在讨论中。

我不知道这是否有帮助,但您可以使用管道实用程序非常轻松地堆叠/组合自定义分类器:

如果您使用
sklearn.emble.AdaBoostClassifier
,那么答案是肯定的:
您可以自己指定基估计量。

管道不是集成方法。他们只将单个分类器与一系列预处理步骤结合起来。是的,你说得对。但我的意思是,使用流水线和FeatureUnion可以在几行代码中结合使用同质或异质模型。例如,Ramp经常使用这个原理。