Image 图像机器学习-通过创建当前数据集图像的旋转副本来扩展数据集是一个好主意吗?

Image 图像机器学习-通过创建当前数据集图像的旋转副本来扩展数据集是一个好主意吗?,image,matlab,image-processing,machine-learning,deep-learning,Image,Matlab,Image Processing,Machine Learning,Deep Learning,我有不同种类的医学X射线图像,但它们的数量并不相等。每个类中的图像数量从十个到数千个不等。如果我不能在每个类中获得更多图像,那么通过在当前数据集中创建图像的旋转副本来扩展当前数据集是一个好主意吗 是否需要每个类中的图像数量相等?从我对训练图像处理算法的有限理解来看,您拥有的图像越多,您对算法适用于各种测试图像的信心就越大。因此,如果您在身体的不同部位测试算法,并且身体的每个部位都有不同数量的图像,那么您的算法在身体不同部位的表现会有不同的置信度(训练图像越少,您对算法对各种输入图像的鲁棒性就越缺

我有不同种类的医学X射线图像,但它们的数量并不相等。每个类中的图像数量从十个到数千个不等。如果我不能在每个类中获得更多图像,那么通过在当前数据集中创建图像的旋转副本来扩展当前数据集是一个好主意吗

是否需要每个类中的图像数量相等?从我对训练图像处理算法的有限理解来看,您拥有的图像越多,您对算法适用于各种测试图像的信心就越大。因此,如果您在身体的不同部位测试算法,并且身体的每个部位都有不同数量的图像,那么您的算法在身体不同部位的表现会有不同的置信度(训练图像越少,您对算法对各种输入图像的鲁棒性就越缺乏信心)

测试图像的多样性是一个关键概念。您建议旋转图像以使算法更加多样。这可能会起作用,但也可能会导致问题,因为旋转可能会在原始原始数据中从未出现的数据中产生/人为错误。这可能会错误地训练您的算法(当这些特征永远不会出现在原始的未旋转数据中时,它可能会开始将这些工件识别为特征)


总之,我的建议是找到获取更多图像的方法,而不是操纵当前有限的图像集并可能错误地训练算法。

为什么要创建图像副本?如果您正在对图像进行机器学习/深入学习,复制示例图像不会使算法成为一种训练ny更好。让它们相等是什么意思?你的意思是让每个类中的图像数量相等吗?如果你只想创建一个副本,那么copy=existing是错误的吗?你还想让它们都处于相同的视角吗?@mechtenginer。所以如果我在每个类中的图像数量不平衡。(意味着类中的图像总数约为10100350578等,如肘部、手部、肩部、颈部。)这样可以吗?@Vahni是的,我想使图像的数量相等。假设所有类都应该有500个图像。而不是10100350578。因为它们是x光图像,我想对现有图像进行一些旋转。如何做到这一点。是的,你说的可能是真的。(人为错误)。我对图像处理的了解也很有限,因为我是一名新手。但由于图像数据集是由IMAGECLEF提供的,因此获取更多图像很困难。因此,由于其本质上的不平衡性,如何使其平衡并进行处理对我们来说是一个挑战。因此,我正在尝试这种方法。