是否有Python函数可以随机拆分deepchem.data.NumpyDataset?

是否有Python函数可以随机拆分deepchem.data.NumpyDataset?,python,deep-learning,splitter,Python,Deep Learning,Splitter,我正在尝试将一个deepchem.data.NumpyDataset随机拆分为大约5个NumpyDataset,以便遵循一种遗漏方法来拟合模型。我尝试过的函数的每个选项都会将数据集转换为数组或不同类型的数据集,或者不随机选择数据 我仍然是这些模块的初学者,因此如果有人更熟悉deepchem,我将非常感谢任何帮助 谢谢大家! 如果您只需要培训、验证和测试拆分,可以使用deepchem.splits.splitters中的一个拆分器。比如说 假设数据集是一个deepchem.data.NumpyDa

我正在尝试将一个deepchem.data.NumpyDataset随机拆分为大约5个NumpyDataset,以便遵循一种遗漏方法来拟合模型。我尝试过的函数的每个选项都会将数据集转换为数组或不同类型的数据集,或者不随机选择数据

我仍然是这些模块的初学者,因此如果有人更熟悉deepchem,我将非常感谢任何帮助


谢谢大家!

如果您只需要培训、验证和测试拆分,可以使用deepchem.splits.splitters中的一个拆分器。比如说

假设数据集是一个deepchem.data.NumpyDataset 从deepchem.splits.spliters导入IndexSpliter 序列数据,有效数据,测试数据=拆分器。拆分数据集,分形序列=0.7,分形有效=0.2,分形测试=0.1
改编自

谢谢您的回复!我正在寻找一种方法,我可以通过一个for循环来训练一个模型,例如,使用训练集的4/5进行训练,最后的1/5进行验证,然后再次这样做,但选择不同的4/5和1/5。我希望这是有意义的。它非常有意义,顺便说一下,这叫做交叉验证。我对deepchem库不是非常熟悉,但您可以实现的一种方法是多次使用拆分器。训练数据0,有效数据0,分裂数据集,分形训练=0.8,分形有效=0.2,分形测试=0.0,然后训练数据1,有效数据1,分裂数据集,分形训练=0.8,分形有效=0.2,分形测试=0.0等等…这是个好主意,我来看看我能做些什么!非常感谢。