Machine learning 如何在ML中保存特征工程模型_Machine Learning_Pickle_Joblib

Machine learning 如何在ML中保存特征工程模型

machine-learning

Machine learning 如何在ML中保存特征工程模型,machine-learning,pickle,joblib,Machine Learning,Pickle,Joblib,建立模型后，我们保存模型以进行实时预测。但是，如果没有特征工程，保存模型将很简单，比如说，我做了一些chisquare、Randomforest来获得一些有助于模型准确性的特征。但当我保存此模型时，用于构建此模型的功能将与训练模型期间传递的原始数据完全不同提前tnx。TL DR:在通过模型之前，您还必须对看不见的数据运行特征生成管道长版本：功能不保存在模型中，而是保存参数。例如，在笛卡尔平面上有10个不同的点（x和y坐标是特征），然后将它们转换为极坐标，例如r和theta。此后，您将其建模为

建立模型后，我们保存模型以进行实时预测。但是，如果没有特征工程，保存模型将很简单，比如说，我做了一些chisquare、Randomforest来获得一些有助于模型准确性的特征。但当我保存此模型时，用于构建此模型的功能将与训练模型期间传递的原始数据完全不同

提前tnx。

TL DR:在通过模型之前，您还必须对看不见的数据运行特征生成管道

长版本：功能不保存在模型中，而是保存参数。例如，在笛卡尔平面上有10个不同的点（

和

坐标是特征），然后将它们转换为极坐标，例如

和

theta

。此后，您将其建模为一个圆。根据变换后的特征（极坐标空间中的坐标），计算圆的最佳拟合中心

和半径

。然后可以将中心和半径保存为模型。模型中没有保存的功能，而是参数

和

。现在给定一个新点，在使用模型进行决策之前，将其转换为极坐标空间。因此，特征生成管道（在上面的示例中转换为极坐标空间）以及模型（中心和半径）对于建模目的来说已经足够了。

希望这能澄清疑问。

恐怕我不明白你的问题。您有一个包含所有原始数据的数据集

。您在

（特征工程）中创建、转换和调整一些变量，然后在转换后的

上训练您的模型，找到最佳的一个（这可能需要创建更多列），然后您就有了最终的

和最终模型。你可以保存你的最终模型，它应该与你的上一个

匹配，不是吗？tnx的帮助@SukuyaYou可以接受其他人关闭的答案。谢谢