Numpy 多维数组的LeavePGroupsOut

Numpy 多维数组的LeavePGroupsOut,numpy,multidimensional-array,scikit-learn,k-fold,Numpy,Multidimensional Array,Scikit Learn,K Fold,我正在研究一个问题,由于有一个小规模的数据集,我试图实现遗漏式分析 目前我正在做这个特别的工作,我偶然发现了scikit Leave PGroupSout函数 我读了文档,但我不知道如何在多维数组中使用它 我的数据如下:我有50个主题,每个主题大约有20个条目(不固定),每个条目有20个特征,每个条目都有基本真实值(0或1)。文档实际上非常清楚: 在您的情况下,您需要连接数组s.t。您可以为每个条目提供组索引。因此,您的功能阵列将具有50*20个数据点乘以20个功能(1000,20)的形状,因

我正在研究一个问题,由于有一个小规模的数据集,我试图实现遗漏式分析

目前我正在做这个特别的工作,我偶然发现了scikit Leave PGroupSout函数

我读了文档,但我不知道如何在多维数组中使用它


我的数据如下:我有50个主题,每个主题大约有20个条目(不固定),每个条目有20个特征,每个条目都有基本真实值(0或1)。

文档实际上非常清楚:

在您的情况下,您需要连接数组s.t。您可以为每个条目提供组索引。因此,您的功能阵列将具有50*20个数据点乘以20个功能(1000,20)的形状,因此您的组阵列也需要具有形状(1000,)

然后您需要通过定义交叉验证

lpgo = LeavePGroupsOut(n_groups=n_groups)
需要注意的是,这将导致遗漏测试组的所有可能组合