Python 使用auto sklearn中的refit（）进行增量学习_Python_Scikit Learn_Automl

Python 使用auto sklearn中的refit（）进行增量学习

python scikit-learn

Python 使用auto sklearn中的refit（）进行增量学习,python,scikit-learn,automl,Python,Scikit Learn,Automl,我有一个包含50k行和10k列的大型数据集。我试图用自动学习中的分类器来拟合这些数据。由于资源有限，我已将数据分为多个批次，并打算使用增量学习。是否可以在第一批上使用autosklearn.classification.AutoSklearnClassifier.fit（），然后在其余批次上使用autosklearn.classification.AutoSklearnClassifier.refit（）？ API文档说明：重新安装（X，y）根据新数据重新安装找到的所有型号。在使用交叉验证

我有一个包含50k行和10k列的大型数据集。我试图用自动学习中的分类器来拟合这些数据。由于资源有限，我已将数据分为多个批次，并打算使用增量学习。是否可以在第一批上使用autosklearn.classification.AutoSklearnClassifier.fit（），然后在其余批次上使用autosklearn.classification.AutoSklearnClassifier.refit（）？ API文档说明：

重新安装（X，y）

根据新数据重新安装找到的所有型号。在使用交叉验证时需要。在训练期间，auto-sklearn在数据集上拟合每个模型k次，但不保持任何经过训练的模型，因此不能用于预测新的数据点。此方法适用于调用fit期间找到的所有模型根据给出的数据。此方法也可与保持剂一起使用避免仅使用66%的训练数据来拟合最终模型。参数：
X：形状的数组状或稀疏矩阵=[n_样本，n_特征] 训练输入样本。 y：类似数组的，形状=[n_个样本]或[n_个样本，n_个输出] 目标

这是否意味着只有在原始数据上使用交叉验证时，refit才有效，还是第一行意味着后续批次的数据可以在同一模型上重新训练

任何想法/想法？

refit

仅用于在执行交叉验证后将估计器拟合到训练集上。您所追求的方法是

partial_-fit

，例如，您可以将此方法与

SGDRegressor

一起使用，文档是

谢谢，但我正在寻找auto sklearn中用于二进制分类的partial_-fit函数。我自己找不到。