Python随机林分类器(如何测试)
我已经能够在数据集上创建一个RandomForestClassifierPython随机林分类器(如何测试),python,scikit-learn,random-forest,Python,Scikit Learn,Random Forest,我已经能够在数据集上创建一个RandomForestClassifier clf = RandomForestClassifier(n_estimators=100, random_state = 101) 然后我可以在测试数据上使用它,如下所示: prediction = pd.DataFrame(clf.predict(x)) # x = Matrix of predictor values 因此,我的问题是,如何在Python之外测试clf.predict,如何查看正在使用的值
clf = RandomForestClassifier(n_estimators=100, random_state = 101)
然后我可以在测试数据上使用它,如下所示:
prediction = pd.DataFrame(clf.predict(x)) # x = Matrix of predictor values
因此,我的问题是,如何在Python之外测试clf.predict,如何查看正在使用的值,如何“手动”测试它,例如,如果在回归中获得Beta,那么可以在Excel中使用这些值并复制模型。如何在Python中使用随机森林实现这一点
还有没有一个类似于Rsquared的指标来测试模型的解释能力
谢谢 RandomForestClassifier是树的集合,这意味着它由多棵树组成 为了能够测试我建议在Python中使用的树,您可以访问分类器的
估计器
属性中的所有树,然后使用export\u graphviz
从sklearn.tree
模块将它们导出为图形
如果坚持导出树,则需要导出由每个树组成的所有规则。为此,您可以按照sklearn文档中的说明进行操作
关于指标,对于分类问题,您可以使用
sklearn.metrics
模块中的accurity\u score
RandomForestClassifier是树的集合,这意味着它由多棵树组成
为了能够测试我建议在Python中使用的树,您可以访问分类器的估计器
属性中的所有树,然后使用export\u graphviz
从sklearn.tree
模块将它们导出为图形
如果坚持导出树,则需要导出由每个树组成的所有规则。为此,您可以按照sklearn文档中的说明进行操作
关于指标,对于分类问题,您可以使用sklearn.metrics
模块中的accurity\u score