Machine learning 如何在sklearn的集成分类器中使用自定义分类器？_Machine Learning_Nlp_Scikits_Scikit Learn

Machine learning 如何在sklearn的集成分类器中使用自定义分类器？

machine-learning nlp scikit-learn

Machine learning 如何在sklearn的集成分类器中使用自定义分类器？,machine-learning,nlp,scikits,scikit-learn,Machine Learning,Nlp,Scikits,Scikit Learn,我了解到sklearn中的内置集成方法使用决策树作为基本分类器。是否可以改用自定义分类器？如果您指的是随机林类，则不可以，这目前不可能。允许其他估计器的选项在去年1月的scikit learn邮件列表中讨论过，但我不相信有任何实际的代码出现在讨论中。我不知道这是否有帮助，但您可以使用管道实用程序非常轻松地堆叠/组合自定义分类器：如果您使用sklearn.emble.AdaBoostClassifier，那么答案是肯定的：您可以自己指定基估计量。管道不是集成方法。他们只将单个分类器与一系列预处理

我了解到sklearn中的内置集成方法使用决策树作为基本分类器。是否可以改用自定义分类器？

如果您指的是随机林类，则不可以，这目前不可能。允许其他估计器的选项在去年1月的scikit learn邮件列表中讨论过，但我不相信有任何实际的代码出现在讨论中。

我不知道这是否有帮助，但您可以使用管道实用程序非常轻松地堆叠/组合自定义分类器：

如果您使用

sklearn.emble.AdaBoostClassifier

，那么答案是肯定的：

您可以自己指定基估计量。

管道不是集成方法。他们只将单个分类器与一系列预处理步骤结合起来。是的，你说得对。但我的意思是，使用流水线和FeatureUnion可以在几行代码中结合使用同质或异质模型。例如，Ramp经常使用这个原理。