Python 交叉验证是否会对样本外准确度进行有偏差的估计?

Python 交叉验证是否会对样本外准确度进行有偏差的估计?,python,machine-learning,Python,Machine Learning,我们通常避免训练/测试,因为估计值会随着我们训练样本和测试样本的不同而变化,因此估计值会有差异。然后我们选择交叉验证。由于第二次迭代中的模型已经在第一次迭代中看到了一些数据,估计值是否仍然有偏差?在不同的迭代中不会有信息泄漏吗 >>> from sklearn.model_selection import cross_val_score >>> cross_val_score(sgd_clf, X_train, y_train_5, cv=3, sc

我们通常避免训练/测试,因为估计值会随着我们训练样本和测试样本的不同而变化,因此估计值会有差异。然后我们选择交叉验证。由于第二次迭代中的模型已经在第一次迭代中看到了一些数据,估计值是否仍然有偏差?在不同的迭代中不会有信息泄漏吗

>>> from sklearn.model_selection import cross_val_score
>>> cross_val_score(sgd_clf, X_train, y_train_5, cv=3, 
    scoring="accuracy") array([0.96355, 0.93795, 0.95615])

不,每次迭代都会对模型进行完全的重新训练。