Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/api/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 列车试验验证中的非重叠数据_Python_Validation_Testing_Split_Training Data - Fatal编程技术网

Python 列车试验验证中的非重叠数据

Python 列车试验验证中的非重叠数据,python,validation,testing,split,training-data,Python,Validation,Testing,Split,Training Data,我试图为卫星图像分类的一些深入学习问题创建一个函数。我已经搜索了很多图书馆,但我没有找到我的需要我尝试了这个sikit学习,但我觉得这不是我需要的 我可能看不到任何关于专门功能的提示?sklearn train\u test\u split似乎满足您的所有需求 这应该可以解决问题。如果愿意,可以分别在X和y数据上使用置换数组 num_tr, num_va = int(len(data)*0.5), int(len(data)*0.2) perm = np.random.permutation(l

我试图为卫星图像分类的一些深入学习问题创建一个函数。我已经搜索了很多图书馆,但我没有找到我的需要我尝试了这个sikit学习,但我觉得这不是我需要的


我可能看不到任何关于专门功能的提示?

sklearn train\u test\u split似乎满足您的所有需求


这应该可以解决问题。如果愿意,可以分别在X和y数据上使用置换数组

num_tr, num_va = int(len(data)*0.5), int(len(data)*0.2)
perm = np.random.permutation(len(data))
tr_data = data[perm[:num_tr]]
va_data = data[perm[num_tr:num_tr+num_va]]
te_data = data[perm[num_tr+num_va:]]

它不能确保集合是唯一的。它只是分裂,好的。你能再给我解释一下“每个组中都有唯一的数据,没有多余的数据”是什么意思吗?我的意思是,例如,如果我的数据是1,2,3,4,5,6,7,8,9,在拆分过程中,我需要在一个集合中有“1”(测试或训练或验证)与“2”相同例如,在测试和验证集中,我没有找到5。我认为这会在读取数据时将其按部分拆分。它不洗牌,也不从不同的部分取集?我希望函数像我说的那样,以保持我提供的数据的形式和约束。我相信我当时不理解你的问题。您要对数据进行洗牌还是排序?如果你两者都想要,什么应该被洗牌,什么应该保持有序?