Python 列车试验验证中的非重叠数据
我试图为卫星图像分类的一些深入学习问题创建一个函数。我已经搜索了很多图书馆,但我没有找到我的需要我尝试了这个sikit学习,但我觉得这不是我需要的Python 列车试验验证中的非重叠数据,python,validation,testing,split,training-data,Python,Validation,Testing,Split,Training Data,我试图为卫星图像分类的一些深入学习问题创建一个函数。我已经搜索了很多图书馆,但我没有找到我的需要我尝试了这个sikit学习,但我觉得这不是我需要的 我可能看不到任何关于专门功能的提示?sklearn train\u test\u split似乎满足您的所有需求 这应该可以解决问题。如果愿意,可以分别在X和y数据上使用置换数组 num_tr, num_va = int(len(data)*0.5), int(len(data)*0.2) perm = np.random.permutation(l
我可能看不到任何关于专门功能的提示?sklearn train\u test\u split似乎满足您的所有需求
这应该可以解决问题。如果愿意,可以分别在X和y数据上使用置换数组
num_tr, num_va = int(len(data)*0.5), int(len(data)*0.2)
perm = np.random.permutation(len(data))
tr_data = data[perm[:num_tr]]
va_data = data[perm[num_tr:num_tr+num_va]]
te_data = data[perm[num_tr+num_va:]]
它不能确保集合是唯一的。它只是分裂,好的。你能再给我解释一下“每个组中都有唯一的数据,没有多余的数据”是什么意思吗?我的意思是,例如,如果我的数据是1,2,3,4,5,6,7,8,9,在拆分过程中,我需要在一个集合中有“1”(测试或训练或验证)与“2”相同例如,在测试和验证集中,我没有找到5。我认为这会在读取数据时将其按部分拆分。它不洗牌,也不从不同的部分取集?我希望函数像我说的那样,以保持我提供的数据的形式和约束。我相信我当时不理解你的问题。您要对数据进行洗牌还是排序?如果你两者都想要,什么应该被洗牌,什么应该保持有序?