Machine learning 是不是；tpot“；当对新的样本外数据调用.score或.predict时，模型对象自动应用任何缩放或其他转换？_Machine Learning_Automl_Tpot

Machine learning 是不是；tpot“；当对新的样本外数据调用.score或.predict时，模型对象自动应用任何缩放或其他转换？

machine-learning

Machine learning 是不是；tpot“；当对新的样本外数据调用.score或.predict时，模型对象自动应用任何缩放或其他转换？,machine-learning,automl,tpot,Machine Learning,Automl,Tpot,以下是在TPOT中培训模型的基本代码： from tpot import TPOTClassifier from sklearn.datasets import load_digits from sklearn.model_selection import train_test_split digits = load_digits() X_train, X_test, y_train, y_test = train_test_split(digits.data, digits.target,

以下是在TPOT中培训模型的基本代码：

from tpot import TPOTClassifier
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split

digits = load_digits()
X_train, X_test, y_train, y_test = train_test_split(digits.data, digits.target,
                                                    train_size=0.75, test_size=0.25, random_state=42)

tpot = TPOTClassifier(generations=5, population_size=50, verbosity=2, random_state=42)
tpot.fit(X_train, y_train)
print(tpot.score(X_test, y_test))

最后，它在测试集上对数据进行评分，而不显式地执行在训练集上完成的转换。这里有几个问题

当对新的样本外数据调用.score或.predict时，“tpot”模型对象是否自动应用任何缩放或其他转换

如果不是，在调用.score.predict之前，对测试集执行转换的正确方法是什么

如果我完全误解了这一点，请教育我。多谢各位

当对新的样本外数据调用.score或.predict时，“tpot”模型对象是否自动应用任何缩放或其他转换

这取决于TPOT选择的最终管道。但是，如果TPOT选择的最终管道具有任何类型的数据缩放或转换，那么它也会在

predict

和

score

函数中正确应用这些缩放和转换操作

原因是，在发动机罩下，TPOT正在优化

也就是说，如果您希望保证数据发生特定的转换，那么您有两个选择：

您可以将数据拆分为培训和测试，学习培训集上的转换（例如，

StandardScaler

），然后将其应用于测试集。在将数据传递给TPOT之前，您将执行这两个操作

您可以使用，它允许您指定分析管道外观的约束

那么，我是否可以在全新的数据上使用tpot.predict（），这些数据不在训练测试分割中，而不必使用管道中的所有步骤减去估计器进行转换？我是否理解正确：预测方法自动执行这些步骤？对不起，如果我用不同的方式问同一件事，我只是想确定我有这个。是的，这是正确的。TPOT在将数据传递到TPOT后学会的任何转换，也将应用于

predict

函数。在AutoML中，您无需担心预处理，它将由AutoML处理。只需调用

fit（）

方法，然后就可以使用AutoML对象来计算预测。我还建议您检查MLJAR AutoML—它有ML解释和自动文档