Machine learning 在识别手写数字时,为什么我们应该在输出层使用10个神经元,而不是4个神经元?

Machine learning 在识别手写数字时,为什么我们应该在输出层使用10个神经元,而不是4个神经元?,machine-learning,neural-network,Machine Learning,Neural Network,我已经阅读了第1章,在一个简单的分类网络中,你可以用ctrl-f搜索手写数字,我发现了一个很好的问题:为什么我们应该在输出层使用10个神经元,而不是4个神经元 对于4个神经元,每个神经元的值为0或1,然后表示2^4=16>10。那么,为什么我们不在输出层使用4个神经元呢?每个输出神经元负责一个数字。输出神经元i共10个神经元返回概率[0,1输入数字是i。这样,当您将每个数字用作2^4的示例中的位时,您知道每个数字的概率分布,而不仅仅是单个输出。每个输出神经元负责单个数字。输出神经元i总共10个神

我已经阅读了第1章,在一个简单的分类网络中,你可以用ctrl-f搜索手写数字,我发现了一个很好的问题:为什么我们应该在输出层使用10个神经元,而不是4个神经元


对于4个神经元,每个神经元的值为0或1,然后表示2^4=16>10。那么,为什么我们不在输出层使用4个神经元呢?

每个输出神经元负责一个数字。输出神经元i共10个神经元返回概率[0,1输入数字是i。这样,当您将每个数字用作2^4的示例中的位时,您知道每个数字的概率分布,而不仅仅是单个输出。

每个输出神经元负责单个数字。输出神经元i总共10个神经元将返回概率[0,1输入数字是i。这样,当您将每个数字用作2^4的示例中的位时,您可以知道每个数字的概率分布,而不仅仅是单个输出。

@serhiyb是正确的。通过计算每个可能的类的logit,您可以使用交叉熵损失,它会根据置信度按比例惩罚错误。即mi高置信度的SCL分类比低置信度的错误分类损失更大。此模型性能度量优于准确性。@serhiyb是正确的。通过计算每个可能的类的登录,您可以使用交叉熵损失,它根据置信度按比例惩罚错误。即错误分类w与低置信度的错误分类相比,高置信度的错误分类会带来更大的损失。这种模型性能的度量比准确度更好。