Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/353.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 使用auto sklearn中的refit()进行增量学习_Python_Scikit Learn_Automl - Fatal编程技术网

Python 使用auto sklearn中的refit()进行增量学习

Python 使用auto sklearn中的refit()进行增量学习,python,scikit-learn,automl,Python,Scikit Learn,Automl,我有一个包含50k行和10k列的大型数据集。我试图用自动学习中的分类器来拟合这些数据。由于资源有限,我已将数据分为多个批次,并打算使用增量学习。是否可以在第一批上使用autosklearn.classification.AutoSklearnClassifier.fit(),然后在其余批次上使用autosklearn.classification.AutoSklearnClassifier.refit()? API文档说明: 重新安装(X,y) 根据新数据重新安装找到的所有型号。 在使用交叉验证

我有一个包含50k行和10k列的大型数据集。我试图用自动学习中的分类器来拟合这些数据。由于资源有限,我已将数据分为多个批次,并打算使用增量学习。是否可以在第一批上使用autosklearn.classification.AutoSklearnClassifier.fit(),然后在其余批次上使用autosklearn.classification.AutoSklearnClassifier.refit()? API文档说明:

重新安装(X,y)

根据新数据重新安装找到的所有型号。 在使用交叉验证时需要。在训练期间,auto-sklearn在数据集上拟合每个模型k次,但不保持 任何经过训练的模型,因此不能用于预测新的 数据点。此方法适用于调用fit期间找到的所有模型 根据给出的数据。此方法也可与保持剂一起使用 避免仅使用66%的训练数据来拟合最终模型。 参数:
X:形状的数组状或稀疏矩阵=[n_样本,n_特征] 训练输入样本。 y:类似数组的,形状=[n_个样本]或[n_个样本,n_个输出] 目标

这是否意味着只有在原始数据上使用交叉验证时,refit才有效,还是第一行意味着后续批次的数据可以在同一模型上重新训练


任何想法/想法?

refit
仅用于在执行交叉验证后将估计器拟合到训练集上。您所追求的方法是
partial_-fit
,例如,您可以将此方法与
SGDRegressor
一起使用,文档是

谢谢,但我正在寻找auto sklearn中用于二进制分类的partial_-fit函数。我自己找不到。