Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/cocoa/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Neural network 猫和狗的神经网络欠拟合_Neural Network_Training Data_Bias Neuron - Fatal编程技术网

Neural network 猫和狗的神经网络欠拟合

Neural network 猫和狗的神经网络欠拟合,neural-network,training-data,bias-neuron,Neural Network,Training Data,Bias Neuron,我不一定要进入它的代码,但更多地关注原则,我有一个问题,我认为什么是不合适的 如果我正在训练一个识别图像是否是狗的网络,我可能有40000个图像,其中所有狗图像都标记为1,所有其他图像都标记为0-我该如何确保准确性,以便,如果这些图像中只有5000个是狗,网络不会“懒惰地”行动从它的训练,也标签狗接近0比1 例如,这个问题的主要目的是能够高精度地识别图像是否真的是狗的图像,而不需要太在意其他图像,除了它们不是狗的事实。此外,我希望能够保留猜测正确的概率,因为这对我的目的非常重要 我唯一能想到的两

我不一定要进入它的代码,但更多地关注原则,我有一个问题,我认为什么是不合适的

如果我正在训练一个识别图像是否是狗的网络,我可能有40000个图像,其中所有狗图像都标记为1,所有其他图像都标记为0-我该如何确保准确性,以便,如果这些图像中只有5000个是狗,网络不会“懒惰地”行动从它的训练,也标签狗接近0比1

例如,这个问题的主要目的是能够高精度地识别图像是否真的是狗的图像,而不需要太在意其他图像,除了它们不是狗的事实。此外,我希望能够保留猜测正确的概率,因为这对我的目的非常重要

我唯一能想到的两件事是:

  • 网络中有更多节点,或
  • 有一半的图片是狗的(所以使用10000张图片,其中5000张是狗)
  • 但我认为这第二种选择可能会给狗一个不成比例的机会成为测试数据的输出,这将破坏准确性和整个网络的目的


    我相信这个问题以前已经解决过了,所以即使是在正确的方向上提出一点,我们也将不胜感激

    因此,您有一个二进制分类任务,其中两个类在数据集中以不同的频率出现。大约1/8是“狗”,7/8是“没有狗”

  • 为了避免对一门或另一门课程的学习产生偏见,重要的是您必须提供培训、验证和测试数据,以便在每个子集中保留这些分数

  • 你说你想“保留猜测正确的概率”——我想你的意思是你想评估“狗性”——概率作为输出变量。这是一个简单的输出层,有两个输出:第一个是“狗”,第二个是“非狗”。这是解决分类问题的典型方法,不管需要区分多少类


  • 谢谢如果它不善于识别狗,并且每次在狗身上测试时都会给出一个接近0而不是1的答案,这是否也是拟合不足的问题呢?如果你一直在拟合你的模型,我宁愿说这可能是(1)图像数据准备的问题,也就是说,你的数据处理得很好,或者(2)您的整体架构有一个问题-在这种情况下,我要说的是,坚持使用文献中经过验证的模型,而不是创建自己的模型(如果您还没有这样做),谢谢!我很感激。