Machine learning 如何在ML中保存特征工程模型

Machine learning 如何在ML中保存特征工程模型,machine-learning,pickle,joblib,Machine Learning,Pickle,Joblib,建立模型后,我们保存模型以进行实时预测。但是,如果没有特征工程,保存模型将很简单,比如说,我做了一些chisquare、Randomforest来获得一些有助于模型准确性的特征。但当我保存此模型时,用于构建此模型的功能将与训练模型期间传递的原始数据完全不同 提前tnx。TL DR:在通过模型之前,您还必须对看不见的数据运行特征生成管道 长版本:功能不保存在模型中,而是保存参数。例如,在笛卡尔平面上有10个不同的点(x和y坐标是特征),然后将它们转换为极坐标,例如r和theta。此后,您将其建模为

建立模型后,我们保存模型以进行实时预测。但是,如果没有特征工程,保存模型将很简单,比如说,我做了一些chisquare、Randomforest来获得一些有助于模型准确性的特征。但当我保存此模型时,用于构建此模型的功能将与训练模型期间传递的原始数据完全不同


提前tnx。

TL DR:在通过模型之前,您还必须对看不见的数据运行特征生成管道

长版本:功能不保存在模型中,而是保存参数。例如,在笛卡尔平面上有10个不同的点(
x
y
坐标是特征),然后将它们转换为极坐标,例如
r
theta
。此后,您将其建模为一个圆。根据变换后的特征(极坐标空间中的坐标),计算圆的最佳拟合中心
C
和半径
r
。然后可以将中心和半径保存为模型。模型中没有保存的功能,而是参数
C
r
。现在给定一个新点,在使用模型进行决策之前,将其转换为极坐标空间。 因此,特征生成管道(在上面的示例中转换为极坐标空间)以及模型(中心和半径)对于建模目的来说已经足够了。
希望这能澄清疑问。

恐怕我不明白你的问题。您有一个包含所有原始数据的数据集
x
。您在
x
(特征工程)中创建、转换和调整一些变量,然后在转换后的
x
上训练您的模型,找到最佳的一个(这可能需要创建更多列),然后您就有了最终的
x
和最终模型。你可以保存你的最终模型,它应该与你的上一个
x
匹配,不是吗?tnx的帮助@SukuyaYou可以接受其他人关闭的答案。谢谢