Machine learning 使用cross_val_score()的正确方法是什么
考虑这样的函数调用:Machine learning 使用cross_val_score()的正确方法是什么,machine-learning,scikit-learn,cross-validation,Machine Learning,Scikit Learn,Cross Validation,考虑这样的函数调用:cross\u val\u score(model,X,y,cv) 在调用这个函数之前,我已经用DecisionTreeClassifier().fit()对一个模型进行了训练,我们称它为trained\u model 我有以下问题: 模型:我应该向该参数传递什么DecisionTreeClassifier(),DecisionTreeClassifier().fit()或训练型 当我构建训练的\u模型时,我已经为分类器设置了随机的\u状态,并且训练测试\u分割()。我是否应
cross\u val\u score(model,X,y,cv)
在调用这个函数之前,我已经用
DecisionTreeClassifier().fit()对一个模型进行了训练,我们称它为trained\u model
我有以下问题:
模型
:我应该向该参数传递什么DecisionTreeClassifier()
,DecisionTreeClassifier().fit()
或训练型
当我构建训练的\u模型
时,我已经为分类器设置了随机的\u状态
,并且训练测试\u分割()。我是否应该在cross\u val\u score()
中设置random\u state
X,y
:我应该向这些参数传递什么<代码>X\U列,y\U列
还是只X,y
当前我的cross\u val\u score()
调用如下:scores\u dtree\u cv\u kfold=cross\u val\u scores(经过训练的模型,X,y,cv=kfold(5))
我不太清楚我在做什么
任何人都可以知道我做得是否正确,我是如何错的以及会发生什么?交叉验证是一种测试(未拟合)模型及其参数的方法。
因此,该函数需要非拟合模型(例如,
cross\u val\u score(DecisionTreeClassifier())
)
X,y
应该是整个数据,因为函数会将它们分成k个折叠。欢迎使用;在这里急于开始提问之前,请确保您首先检查了相关的。