Neural network 神经网络分类数据的实现

Neural network 神经网络分类数据的实现,neural-network,Neural Network,我一直把学习神经网络作为一个爱好项目,但我完全不知道如何处理分类数据。我读了这篇文章,它解释了输入数据的规范化,并解释了如何使用效果编码预处理分类数据。我理解将类别分解为向量的概念,但不知道如何实际实现这一点 例如,如果我使用国家作为分类数据(例如芬兰、泰国等),我会将生成的向量处理为单个数字,然后输入到单个输入中,还是会为向量的每个分量提供单独的输入?根据后者,如果有196个不同的国家,这意味着我需要196个不同的输入来处理这一特定数据。如果大量不同的分类数据被传送到网络中,我可以看到这会很快

我一直把学习神经网络作为一个爱好项目,但我完全不知道如何处理分类数据。我读了这篇文章,它解释了输入数据的规范化,并解释了如何使用效果编码预处理分类数据。我理解将类别分解为向量的概念,但不知道如何实际实现这一点

例如,如果我使用国家作为分类数据(例如芬兰、泰国等),我会将生成的向量处理为单个数字,然后输入到单个输入中,还是会为向量的每个分量提供单独的输入?根据后者,如果有196个不同的国家,这意味着我需要196个不同的输入来处理这一特定数据。如果大量不同的分类数据被传送到网络中,我可以看到这会很快变得非常笨拙

有什么我遗漏的吗?分类数据如何精确地映射到神经元输入?

神经网络输入 根据经验:不同的类和类别应该有自己的输入信号。

为什么不能用单个输入对其进行编码 由于神经网络通过激活函数作用于输入值,因此较高的输入值将导致较高的激活输入

较高的输入值将使神经元更有可能激发

只要您不想告诉网络
泰国
芬兰
好,您就可以将国家输入信号编码为
输入值(芬兰)=24,输入值(泰国)=140




它应该如何编码 每个国家都应该得到自己的输入信号,以便它们对激活神经元做出同样的贡献。

如果要添加新输入(例如,新国家/地区),该怎么办?回答得很好。对于那些感兴趣的人来说,这种技术叫做编码。有几种工具,比如来自或内置方法的工具,可以处理此类分类数据,但一种热编码不能处理“新”输入。或者,可以创建自己的OHE算法,添加一个“其他”列,这样当添加新输入时,它可以进入“其他”列列,直到使用新输入更新/训练模型。可能重复@devinbost这就像我在过去5分钟内看到的关于神经网络的第10个问题,您标记为对玩蛇问题的神经网络的澄清的重复,这是一个分数为-5的问题,但你碰巧已经为它写了答案。我发现很难相信所有这些问题都是一个有着如此明确标题的问题的变体。我并不假装理解你这样做的动机,但请解释一下,或者停下来。