Deep learning 我应该将预处理的图像数据保存到磁盘吗?

Deep learning 我应该将预处理的图像数据保存到磁盘吗?,deep-learning,Deep Learning,我正在参加一个摄影比赛。我有近50000个培训数据,涉及80个不同的课程。我用一些预训练的模型做了一些测试,比如Vgg或Resnet,两者都很好,但不够好,训练acc几乎为1,验证acc为0.85(过度拟合)。我认为瓶颈在于数据,而不是模型,所以我提出了图像增强 现在我很困惑,是应该将转换后的图像保存到磁盘上,还是只对每个历元的每一批应用随机转换。我现在正在练习后一种方法,但效果并没有太大改善。保存或不保存预处理的数据首先是时间问题,如果预处理过程中存在任何随机性,则需要大量重复性 如果不需要花

我正在参加一个摄影比赛。我有近50000个培训数据,涉及80个不同的课程。我用一些预训练的模型做了一些测试,比如Vgg或Resnet,两者都很好,但不够好,训练acc几乎为1,验证acc为0.85(过度拟合)。我认为瓶颈在于数据,而不是模型,所以我提出了图像增强


现在我很困惑,是应该将转换后的图像保存到磁盘上,还是只对每个历元的每一批应用随机转换。我现在正在练习后一种方法,但效果并没有太大改善。

保存或不保存预处理的数据首先是时间问题,如果预处理过程中存在任何随机性,则需要大量重复性

如果不需要花费时间,那么在运行中进行应该是更简单的方法。另一方面,如果预处理很繁重(例如,当只训练最后几层并因此使用中间层输出时),则将此结果转储到磁盘会更有用,这样您就不需要每次都计算所有初始层

换句话说,这不是一个技术问题,转储数据或不转储数据不应该干扰您的结果,而只是一个方便的问题