Python GridSearchCV&;RandomizedSearchCV-运行后是否重新安装模型
我有一些测试和训练数据,测试数据没有任何依赖变量 我目前正在运行GridSearchCV或RandomizedSearchCV以查找最佳参数 我应该将所有的“测试”X&y值传递到GridSearchCV还是随机化SearchCV 我知道它会进行交叉验证,所以我相信这样做可以吗 但如果是这样的话,最好的估计值是什么数据?所有这些?或者来自其中一个褶皱的数据Python GridSearchCV&;RandomizedSearchCV-运行后是否重新安装模型,python,machine-learning,scikit-learn,cross-validation,gridsearchcv,Python,Machine Learning,Scikit Learn,Cross Validation,Gridsearchcv,我有一些测试和训练数据,测试数据没有任何依赖变量 我目前正在运行GridSearchCV或RandomizedSearchCV以查找最佳参数 我应该将所有的“测试”X&y值传递到GridSearchCV还是随机化SearchCV 我知道它会进行交叉验证,所以我相信这样做可以吗 但如果是这样的话,最好的估计值是什么数据?所有这些?或者来自其中一个褶皱的数据 之后是否需要重新安装整套测试数据?这里有很多问题,我将尝试逐一回答 我应该将所有“测试”X&y值传递到GridSearchCV还是Random
之后是否需要重新安装整套测试数据?这里有很多问题,我将尝试逐一回答
GridSearchCV
或RandomSearchCV
,这些方法将在内部创建一个验证集,在该验证集上对每个超参数设置测试您的模型
GridSearchCV
或RandomizedSearchCV
对象,这两种方法都有一个名为的参数,当设置为TRUE
(默认情况下)时,将使用整个数据重新安装模型
希望这有帮助 没有什么可以阻止您使用
测试
数据集为模型找到最佳超参数。但是,在这样做之后,您无法真正判断模型的泛化程度,即在看不见的数据上的行为,因为您使用了测试集来调整模型,使得它对于测量模型的性能毫无用处
我也相信,问这样的问题会是一个更好的地方 嗨,刘易斯·莫里斯,答案对你有帮助吗?