Machine learning 如何使用小数据集提高convnet性能_Machine Learning

Machine learning 如何使用小数据集提高convnet性能

machine-learning

Machine learning 如何使用小数据集提高convnet性能,machine-learning,Machine Learning,我有一个非常小的图像数据集（大约8幅图像）。我知道我的模型可能会导致对小数据集的过度拟合，我想了解一些如何处理如上所述的数据集小的情况。处理此类问题的最佳方法是使用图像增强。目前有几个库提供了类似opencv2、keras、scikit图像的功能。图像增强背后的基本思想是通过对数据进行某些更改（如旋转图像、在某些侧面模糊图像、放大/缩小图像、更改颜色、翻转图像等），从一幅图像中人为创建更多图像。您可以从一个图像创建10x、20x、40x等图像此方法将帮助您生成更多图像，但请记住，8张图像是一个

我有一个非常小的图像数据集（大约8幅图像）。我知道我的模型可能会导致对小数据集的过度拟合，我想了解一些如何处理如上所述的数据集小的情况。

处理此类问题的最佳方法是使用图像增强。目前有几个库提供了类似opencv2、keras、scikit图像的功能。图像增强背后的基本思想是通过对数据进行某些更改（如旋转图像、在某些侧面模糊图像、放大/缩小图像、更改颜色、翻转图像等），从一幅图像中人为创建更多图像。您可以从一个图像创建10x、20x、40x等图像

此方法将帮助您生成更多图像，但请记住，8张图像是一个非常小的数据，这些新的增强图像在某种程度上将具有与原始图像相似的功能。

您是否建议使用GANs来帮助实现这一点？此外，你认为迁移学习会改善情况吗？迁移学习背后的概念是获得一个预训练模型，该模型能够检测数据中的特征，然后根据数据对该模型进行微调。由于您没有足够的数据从头开始训练一个好的模型，迁移学习可能会有所帮助。GANs也有帮助，因为它是一种先进的图像增强方法。你总是可以收集更多的数据，或者这对你来说是一个限制？有一个限制