Python 随机森林分类、变异系数和试验集预测

Python 随机森林分类、变异系数和试验集预测,python,machine-learning,random-forest,cross-validation,Python,Machine Learning,Random Forest,Cross Validation,我一直在阅读随机森林文档,我对如何将交叉验证模型(基于训练数据)应用于测试数据以进行分类预测感到困惑 我的代码如下,但我不知道如何使用它来预测?通常情况下,你会拟合模型,然后调用predict,但我读到你不必对Random Forest调用“fit”——那么,如果我没有先调用fit,我该如何调用predict呢?真糊涂 `clf = RandomForestClassifier(n_estimators=10, max_depth=None, min_samples_split=2, ra

我一直在阅读随机森林文档,我对如何将交叉验证模型(基于训练数据)应用于测试数据以进行分类预测感到困惑

我的代码如下,但我不知道如何使用它来预测?通常情况下,你会拟合模型,然后调用predict,但我读到你不必对Random Forest调用“fit”——那么,如果我没有先调用fit,我该如何调用predict呢?真糊涂

`clf = RandomForestClassifier(n_estimators=10, max_depth=None,
   min_samples_split=2, random_state=0)
   scores = cross_val_score(clf, X_train, y_train, cv = 10, scoring='precision')                      
   y_pred = clf.predict(X_test)`

#未安装错误:估计器未安装,请在使用模型之前调用
fit

您需要在
X\u列
y\u列
上再次安装()模型。看看我的。谢谢Vivek,所以从编码的角度来看,我现在如何将“分数”(现在定义)输入到我的预测中?我不明白。你能再解释一下吗?现在分数已经应用了CV,那么我如何用我刚刚定义的新分数对象调用predict呢?通过执行
cross\u val\u score()
得到的
scores变量是从估算器返回的每个CV倍的分数数组。它不能用于
predict()
方法。为什么要在
predict()
方法中使用它?