Python 如何在新数据集上使用熊猫进行热编码?
我有一个训练数据集,它有分类功能,我在上面使用了Python 如何在新数据集上使用熊猫进行热编码?,python,pandas,Python,Pandas,我有一个训练数据集,它有分类功能,我在上面使用了pd。让虚拟人进行一次热编码。这将生成一个包含n个要素的数据集。然后,我在此数据集上训练一个具有n个特征的分类模型。如果我现在得到一些具有相同分类特征的新数据,并再次执行一次热编码,则特征的结果数量为m
pd。让虚拟人
进行一次热编码。这将生成一个包含n个要素的数据集。然后,我在此数据集上训练一个具有n个特征的分类模型。如果我现在得到一些具有相同分类特征的新数据,并再次执行一次热编码,则特征的结果数量为mpd.get_dummies(df).reindex(columns=tradf.columns,fill_value=0)
你在用sklearn吗?是的,看看这个