一个不同类别的热编码Python

一个不同类别的热编码Python,python,keras,artificial-intelligence,categorical-data,one-hot-encoding,Python,Keras,Artificial Intelligence,Categorical Data,One Hot Encoding,我正在使用人工神经网络进行ML应用。数据列是分类的。这就是为什么我对所有特性使用一种热编码方法。让我问一下我的问题。想象一下我的专栏 ANTENNA_TYPE 1234 3345 3412 5435 5623 我有5个天线类型。当我进行一次热编码时,输出会是 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 之后,下一次训练和预测 当我想预测不同的天线类型为9999时,我不知道如何转换为一个热编码? 有没有人向我推荐这方面的

我正在使用人工神经网络进行ML应用。数据列是分类的。这就是为什么我对所有特性使用一种热编码方法。让我问一下我的问题。想象一下我的专栏

ANTENNA_TYPE

1234

3345

3412

5435

5623
我有5个天线类型。当我进行一次热编码时,输出会是

1 0 0 0 0

0 1 0 0 0

0 0 1 0 0

0 0 0 1 0

0 0 0 0 1
之后,下一次训练和预测

当我想预测不同的天线类型为9999时,我不知道如何转换为一个热编码? 有没有人向我推荐这方面的最佳做法

提前谢谢

hot_encoder = OneHotEncoder(categorical_features=[1])
dataset = hot_encoder.fit_transform(dataset).toarray()

找到该列的所有类型的类,然后对其进行热编码。我的意思是,在将数据集拆分为测试集和训练集之前,对整个数据集进行热编码。是的,我做到了。但是如果我想预测不同的天线类型,我该怎么办呢?我的模型将作为API使用。我的客户向我发送了他们想要预测的信息?当他们发送新的天线类型时,我如何处理?我如何转换它?为所有列设置1是最佳实践?明白了!但是如果是这样的话,你什么也做不了,因为你的模型的输入层也需要改变。你所能做的就是找到可能的类并修复输入层,否则把它看作是连续的,而不是热编码。