Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/321.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python Scikit学习中的交叉验证_Python_Scikit Learn_Logistic Regression_Cross Validation - Fatal编程技术网

Python Scikit学习中的交叉验证

Python Scikit学习中的交叉验证,python,scikit-learn,logistic-regression,cross-validation,Python,Scikit Learn,Logistic Regression,Cross Validation,我一直在使用 为了交叉验证逻辑回归分类器。我得到的结果是: [ 0.78571429 0.64285714 0.85714286 0.71428571 0.78571429 0.64285714 0.84615385 0.53846154 0.76923077 0.66666667] 我的主要问题是如何找到使分类器得分最大并产生0.857的集合/折叠 接下来的问题:用这套训练分类器是一个好的实践吗 先谢谢你 我是否以及如何找到使分类器得分最大化的集合/折叠 从的文档中

我一直在使用

为了交叉验证逻辑回归分类器。我得到的结果是:

[ 0.78571429  0.64285714  0.85714286  0.71428571  
0.78571429  0.64285714    0.84615385  0.53846154  
0.76923077  0.66666667]
我的主要问题是如何找到使分类器得分最大并产生0.857的集合/折叠

接下来的问题:用这套训练分类器是一个好的实践吗

先谢谢你

我是否以及如何找到使分类器得分最大化的集合/折叠

从的文档中,您可以看到它在特定的
cv
对象上运行。(如果您没有明确给出,则在某些情况下会给出,在其他情况下会给出其他内容-请参阅此处的文档。)

您可以迭代此对象(或相同的对象)以找到确切的训练/测试索引。例如:

for tr, te in KFold(10000, 3):
    # tr, te in each iteration correspond to those which gave you the scores you saw.

使用此集合训练分类器是否是一个好的实践

绝对不是

交叉验证的唯一合法用途是评估总体性能、在不同模型之间进行选择或配置模型参数


一旦您致力于一个模型,您应该在整个培训集中对其进行培训。在恰好给出最佳分数的子集上对其进行训练是完全错误的。

您这里似乎有很多问题。我建议你挑一个最重要的,然后问这个问题。其他问题可能会意外得到回答。:)以防万一,“逻辑回归”本身并不是一个分类器。良好实践建议+1。我只想补充一点,虽然在不同的领域不同,但通常的“良好实践”是在训练集上使用交叉验证进行参数估计,在此训练集上重新训练,然后在看不见的测试集上评估模型。显然,这取决于一个人拥有多少数据!