Machine learning 什么原因导致该模型不能在大量数据的情况下产生更好的结果?

Machine learning 什么原因导致该模型不能在大量数据的情况下产生更好的结果?,machine-learning,keras,generative-adversarial-network,Machine Learning,Keras,Generative Adversarial Network,所以当我和杰夫·希顿网站上的凯拉斯·甘玩的时候。 因为俗话说,我们拥有的数据越多,我们应该得到的结果就越好。我想验证这个假设。另外,我想知道GAN是否可以从数据中复制一个样本 这就是为什么我创建了数字在1到20000之间的图像: 128px 128px 数字居中 全部使用相同的颜色(深蓝色和黄色) 为了验证这个理论,我首先用5000张图像训练了GAN。这是我得到的结果: 然后我用20000张图片进行训练: 我看不出有什么大的进步。有什么好处?我是否需要尝试更多的图像(50000)?我需

所以当我和杰夫·希顿网站上的凯拉斯·甘玩的时候。 因为俗话说,我们拥有的数据越多,我们应该得到的结果就越好。我想验证这个假设。另外,我想知道GAN是否可以从数据中复制一个样本

这就是为什么我创建了数字在1到20000之间的图像:

  • 128px 128px
  • 数字居中
  • 全部使用相同的颜色(深蓝色和黄色)

为了验证这个理论,我首先用5000张图像训练了GAN。这是我得到的结果:

然后我用20000张图片进行训练:


我看不出有什么大的进步。有什么好处?我是否需要尝试更多的图像(50000)?我需要改进GAN的架构吗?

您不需要修改GAN的架构

如果我是你,我会首先开始寻找一个好的指标来检查你的结果如何改善/恶化

老实说,当我观察这两个不同的批次时,第二个批次看起来更加多样化,因此有道理,因为GAN看到了更多的图片,所以它能够生成更大范围的数字