Python 是否有理由只使用.fit()和.transform()而不使用.fit_transform()?

Python 是否有理由只使用.fit()和.transform()而不使用.fit_transform()?,python,python-3.x,scikit-learn,Python,Python 3.x,Scikit Learn,我刚开始学习ML,想知道当.fit\u transform()存在时,为什么要分别做.fit()和.transform()。另外,我通常对fitting/.fit()的确切功能感到困惑 我假设您所谈论的是sklearn的定标器或sklearn的特征转换算法 假设您的数据集被拆分为5个子集,您希望在-1和1之间缩放每个子集: 您可以使用fit在每个子集合上拟合缩放器,这基本上搜索所有集合的最大值和最小值 然后,您可以使用transform 如果您在第一个子集上使用了fit\u transfor

我刚开始学习ML,想知道当
.fit\u transform()
存在时,为什么要分别做
.fit()
.transform()
。另外,我通常对fitting/
.fit()
的确切功能感到困惑

我假设您所谈论的是sklearn的定标器或sklearn的特征转换算法

假设您的数据集被拆分为5个子集,您希望在-1和1之间缩放每个子集:

  • 您可以使用
    fit
    在每个子集合上拟合缩放器,这基本上搜索所有集合的最大值和最小值
  • 然后,您可以使用
    transform
如果您在第一个子集上使用了
fit\u transform
,然后在第二个子集上使用它,它的缩放方式会有所不同,您不希望这样


此外,您可以考虑在训练集中拟合一次,而不是子集,并在内存中保留变换,以缩放将来要传递给模型的样本。

也许您想用相同的拟合变换器对多个数据集进行
变换。@timgeb这到底意味着什么/您能举个例子吗?