Serialization 在sklearn中序列化Labelencoder

Serialization 在sklearn中序列化Labelencoder,serialization,encoding,machine-learning,scikit-learn,Serialization,Encoding,Machine Learning,Scikit Learn,我有一个巨大的数据集,我有一个列,其中有一些分类数据,我想标记为编码。在所有的预处理之后,我可以训练我的模型并使用sklearn序列化模型 现在我面临一个问题,如果一个输入预测向量由标签组成,我该如何在那一点上对其进行编码。因为我不希望每次输入新的预测向量时都对模型进行预处理和重新训练。有没有办法在sklearn中序列化labelencoder?解决这个问题的正确方法是什么?正如ncfirth在他的评论中提到的那样-正确的方法是以序列化分类器(通常是pickle/joblib)的相同方式对其进行

我有一个巨大的数据集,我有一个列,其中有一些分类数据,我想标记为编码。在所有的预处理之后,我可以训练我的模型并使用sklearn序列化模型


现在我面临一个问题,如果一个输入预测向量由标签组成,我该如何在那一点上对其进行编码。因为我不希望每次输入新的预测向量时都对模型进行预处理和重新训练。有没有办法在sklearn中序列化labelencoder?解决这个问题的正确方法是什么?

正如ncfirth在他的评论中提到的那样-正确的方法是以序列化分类器(通常是pickle/joblib)的相同方式对其进行序列化。

您可以按照与分类器相同的方式对其进行pickle(我猜是这样)。