Machine learning 目标均值编码机器学习

Machine learning 目标均值编码机器学习,machine-learning,scikit-learn,categorical-data,one-hot-encoding,feature-engineering,Machine Learning,Scikit Learn,Categorical Data,One Hot Encoding,Feature Engineering,如果我们在分类特征中有很多级别,那么目标均值编码就非常有效。我们可以使用目标均值编码来基于目标均值对这些类别进行编码,而不是创建许多虚拟编码列。但是,正如我们所知道的目标一样,这在模型训练中效果很好。对于模型测试,使用x_测试也可以,因为我们仍然知道y_测试,并且可以在x_测试中编码特性。但是在现实世界中,当我们只有x_测试时,我们如何在x_测试中编码类别,因为没有目标可以按照训练模型的预期执行目标平均编码。 我们能在这样的真实场景中应用目标均值编码吗

如果我们在分类特征中有很多级别,那么目标均值编码就非常有效。我们可以使用目标均值编码来基于目标均值对这些类别进行编码,而不是创建许多虚拟编码列。但是,正如我们所知道的目标一样,这在模型训练中效果很好。对于模型测试,使用x_测试也可以,因为我们仍然知道y_测试,并且可以在x_测试中编码特性。但是在现实世界中,当我们只有x_测试时,我们如何在x_测试中编码类别,因为没有目标可以按照训练模型的预期执行目标平均编码。 我们能在这样的真实场景中应用目标均值编码吗