Scikit learn GridSearchCV(OneVsRestClassifier(clf,…):所有N个分类器的1个最优超参数集,而每个分类器的1个最优超参数集
背景 比方说,在一个多类(分别为多标签)问题中,我们有Scikit learn GridSearchCV(OneVsRestClassifier(clf,…):所有N个分类器的1个最优超参数集,而每个分类器的1个最优超参数集,scikit-learn,multilabel-classification,grid-search,Scikit Learn,Multilabel Classification,Grid Search,背景 比方说,在一个多类(分别为多标签)问题中,我们有L标签可以预测。使用OneVsRestClassifier,正在构建L分类器。让我们假设,我们对单个分类器使用LogisticRegression 使用GridSearchCV(分别为RandomizedSearchCV)搜索最佳超参数时,我们运行: 问题 通过运行上面的GridSearchCV命令,我们将获得一组最佳超参数,用于训练(重新安装)所有L分类器。因此,例如,我们将得到一个最佳值C=10,该值将用于重新安装L分类器的所有 我的问题
L
标签可以预测。使用OneVsRestClassifier
,正在构建L
分类器。让我们假设,我们对单个分类器使用LogisticRegression
使用GridSearchCV
(分别为RandomizedSearchCV
)搜索最佳超参数时,我们运行:
问题
通过运行上面的GridSearchCV
命令,我们将获得一组最佳超参数,用于训练(重新安装)所有L
分类器。因此,例如,我们将得到一个最佳值C=10
,该值将用于重新安装L
分类器的所有
我的问题是为什么GridSearchCV
没有为每个L
分类器返回一组不同的最优超参数。例如,label0
是否为最佳C=10
,label1
是否为最佳C=0.01
?
为什么决定返回一组超参数,而不是每个分类器返回一组超参数
以前的经验
我这样问是因为这种行为与我“手工”训练每个标签分类器时通常得到的不同。例如,对于某些任务,我有数千个标签要预测,我单独训练每个标签分类器(分布在多台机器上),因此我可以肯定地得到每个标签分类器的不同超参数值。我遇到了完全相同的问题,但我没有注意到单个参数/
GridSearchCV()返回的分数。最佳参数
或。最佳分数
对应于重新安装到所有分类器的最佳选择。是否有任何文件证实这一点?
GridSearchCV( OneVsRestClassifier( LogisticRegression(), ...) ).fit(X, y)