Validation 如果我们先增加数据，然后随机选择数据，然后分割数据，可以吗？_Validation_Machine Learning_Training Data_Data Augmentation

Validation 如果我们先增加数据，然后随机选择数据，然后分割数据，可以吗？

validation machine-learning

Validation 如果我们先增加数据，然后随机选择数据，然后分割数据，可以吗？,validation,machine-learning,training-data,data-augmentation,Validation,Machine Learning,Training Data,Data Augmentation,我正在做一个关于医学图像分类的科学项目，但是我没有太多的数据，所以，如果我先增加数据，然后随机选择要保留的数据，然后分割保留的数据，可以吗？起初，我的老师告诉我先增加数据，然后将数据分为训练、验证和测试。但我认为我提出的方法将使训练数据集与测试数据集发生冲突，这将导致精度不现实（太高），因此，我认为我在进行数据扩充后随机选择文件的方法应该有助于增强的数据集之间不太相似，并解决数据集数量不平衡的问题。我们希望我们的模型能够在训练集上得到很好的推广，所以技术上，我们应该只在训练集上进行数据扩充。我建

我正在做一个关于医学图像分类的科学项目，但是我没有太多的数据，所以，如果我先增加数据，然后随机选择要保留的数据，然后分割保留的数据，可以吗？起初，我的老师告诉我先增加数据，然后将数据分为训练、验证和测试。但我认为我提出的方法将使训练数据集与测试数据集发生冲突，这将导致精度不现实（太高），因此，我认为我在进行数据扩充后随机选择文件的方法应该有助于增强的数据集之间不太相似，并解决数据集数量不平衡的问题。

我们希望我们的模型能够在训练集上得到很好的推广，所以技术上，我们应该只在训练集上进行数据扩充。我建议您将数据集分为培训、验证和测试，然后仅在培训集上进行数据扩充。

“因此，从技术上讲，我们应该仅在培训集上进行数据扩充”

：这不是一条硬性规定。查看测试时间增加。同意，这不是一个硬性规定。虽然它会帮助我们获得更好的性能（在某些情况下），但大多数情况下，我们最终只在训练集中进行增强。