Python随机林分类器(如何测试)

Python随机林分类器(如何测试),python,scikit-learn,random-forest,Python,Scikit Learn,Random Forest,我已经能够在数据集上创建一个RandomForestClassifier clf = RandomForestClassifier(n_estimators=100, random_state = 101) 然后我可以在测试数据上使用它,如下所示: prediction = pd.DataFrame(clf.predict(x)) # x = Matrix of predictor values 因此,我的问题是,如何在Python之外测试clf.predict,如何查看正在使用的值

我已经能够在数据集上创建一个RandomForestClassifier

clf = RandomForestClassifier(n_estimators=100, random_state = 101)   
然后我可以在测试数据上使用它,如下所示:

prediction = pd.DataFrame(clf.predict(x)) # x = Matrix of predictor values 
因此,我的问题是,如何在Python之外测试clf.predict,如何查看正在使用的值,如何“手动”测试它,例如,如果在回归中获得Beta,那么可以在Excel中使用这些值并复制模型。如何在Python中使用随机森林实现这一点

还有没有一个类似于Rsquared的指标来测试模型的解释能力


谢谢

RandomForestClassifier是树的集合,这意味着它由多棵树组成

为了能够测试我建议在Python中使用的树,您可以访问分类器的
估计器
属性中的所有树,然后使用
export\u graphviz
sklearn.tree
模块将它们导出为图形

如果坚持导出树,则需要导出由每个树组成的所有规则。为此,您可以按照sklearn文档中的说明进行操作


关于指标,对于分类问题,您可以使用
sklearn.metrics
模块中的
accurity\u score

RandomForestClassifier是树的集合,这意味着它由多棵树组成

为了能够测试我建议在Python中使用的树,您可以访问分类器的
估计器
属性中的所有树,然后使用
export\u graphviz
sklearn.tree
模块将它们导出为图形

如果坚持导出树,则需要导出由每个树组成的所有规则。为此,您可以按照sklearn文档中的说明进行操作

关于指标,对于分类问题,您可以使用
sklearn.metrics
模块中的
accurity\u score