Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/330.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何在新数据集上使用熊猫进行热编码?_Python_Pandas - Fatal编程技术网

Python 如何在新数据集上使用熊猫进行热编码?

Python 如何在新数据集上使用熊猫进行热编码?,python,pandas,Python,Pandas,我有一个训练数据集,它有分类功能,我在上面使用了pd。让虚拟人进行一次热编码。这将生成一个包含n个要素的数据集。然后,我在此数据集上训练一个具有n个特征的分类模型。如果我现在得到一些具有相同分类特征的新数据,并再次执行一次热编码,则特征的结果数量为m

我有一个训练数据集,它有分类功能,我在上面使用了
pd。让虚拟人
进行一次热编码。这将生成一个包含n个要素的数据集。然后,我在此数据集上训练一个具有n个特征的分类模型。如果我现在得到一些具有相同分类特征的新数据,并再次执行一次热编码,则特征的结果数量为m 如果维度与原始训练数据不匹配,我无法预测新数据集的类别

是否有办法在一次热编码后将所有原始n特征包含在新数据集中?

编辑:我正在使用作为我的分类库。

例如

您有列为['A_1','A_2']的tradf

使用新的df,您有列['A'],但只有一个类别1,您可以这样做

pd.get_dummies(df).reindex(columns=tradf.columns,fill_value=0)

你在用sklearn吗?是的,看看这个