Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/356.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python GridSearchCV&;RandomizedSearchCV-运行后是否重新安装模型_Python_Machine Learning_Scikit Learn_Cross Validation_Gridsearchcv - Fatal编程技术网

Python GridSearchCV&;RandomizedSearchCV-运行后是否重新安装模型

Python GridSearchCV&;RandomizedSearchCV-运行后是否重新安装模型,python,machine-learning,scikit-learn,cross-validation,gridsearchcv,Python,Machine Learning,Scikit Learn,Cross Validation,Gridsearchcv,我有一些测试和训练数据,测试数据没有任何依赖变量 我目前正在运行GridSearchCV或RandomizedSearchCV以查找最佳参数 我应该将所有的“测试”X&y值传递到GridSearchCV还是随机化SearchCV 我知道它会进行交叉验证,所以我相信这样做可以吗 但如果是这样的话,最好的估计值是什么数据?所有这些?或者来自其中一个褶皱的数据 之后是否需要重新安装整套测试数据?这里有很多问题,我将尝试逐一回答 我应该将所有“测试”X&y值传递到GridSearchCV还是Random

我有一些测试和训练数据,测试数据没有任何依赖变量

我目前正在运行GridSearchCV或RandomizedSearchCV以查找最佳参数

我应该将所有的“测试”X&y值传递到GridSearchCV还是随机化SearchCV

我知道它会进行交叉验证,所以我相信这样做可以吗

但如果是这样的话,最好的估计值是什么数据?所有这些?或者来自其中一个褶皱的数据


之后是否需要重新安装整套测试数据?

这里有很多问题,我将尝试逐一回答

  • 我应该将所有“测试”X&y值传递到GridSearchCV还是RandomizedSearchCV
  • 您提到您的测试数据没有因变量,在这种情况下,您不能将其传递给您的模型。即使您有权访问因变量的值,也不应将其发送到
    GridSearchCV
    RandomSearchCV
    ,这些方法将在内部创建一个验证集,在该验证集上对每个超参数设置测试您的模型

  • 最佳估计值与哪些数据相吻合
  • 这取决于您如何初始化
    GridSearchCV
    RandomizedSearchCV
    对象,这两种方法都有一个名为的参数,当设置为
    TRUE
    (默认情况下)时,将使用整个数据重新安装模型

  • 之后是否需要重新安装全套测试数据
  • 通常,您不会使用测试数据来调整超参数。您可以使用验证集进行验证,一旦冻结了模型,就可以使用测试集检查模型的性能,这将是对模型性能的无偏估计


    希望这有帮助

    没有什么可以阻止您使用
    测试
    数据集为模型找到最佳超参数。但是,在这样做之后,您无法真正判断模型的泛化程度,即在看不见的数据上的行为,因为您使用了
    测试
    集来调整模型,使得它对于测量模型的性能毫无用处


    我也相信,问这样的问题会是一个更好的地方

    嗨,刘易斯·莫里斯,答案对你有帮助吗?