Machine learning 测试集和开发集与培训集和开发集的分布是否应该不同

Machine learning 测试集和开发集与培训集和开发集的分布是否应该不同,machine-learning,neural-network,deep-learning,conv-neural-network,Machine Learning,Neural Network,Deep Learning,Conv Neural Network,假设我正在构建一个网络来定位一个对象。我的训练数据包括在5个不同位置拍摄的图像,它是一个小数据集(每个位置大约有2k个图像)。我是否应该添加所有图像,将它们重新排列,然后将它们分发到训练(60%)、开发(20%)、测试(20%)中,或者我应该从3个位置获取数据作为训练,1个位置作为测试,1个位置作为开发。理想情况下,训练集、测试集和验证集应该从相同的分发中提取,因此,您应该添加所有图像,将它们洗牌,然后将它们分发到培训(60%)、开发(20%)、测试(20%)中。此外,这将帮助您的网络对位置更具

假设我正在构建一个网络来定位一个对象。我的训练数据包括在5个不同位置拍摄的图像,它是一个小数据集(每个位置大约有2k个图像)。我是否应该添加所有图像,将它们重新排列,然后将它们分发到训练(60%)、开发(20%)、测试(20%)中,或者我应该从3个位置获取数据作为训练,1个位置作为测试,1个位置作为开发。

理想情况下,训练集、测试集和验证集应该从相同的分发中提取,因此,您应该添加所有图像,将它们洗牌,然后将它们分发到培训(60%)、开发(20%)、测试(20%)中。此外,这将帮助您的网络对位置更具不变性(因为它将学习忽略5个位置对3个位置),并有更好的机会在增加多样性的情况下进行泛化