Scikit learn StratifiedShuffleSplit(在sklearn中)每次返回不同的比例

Scikit learn StratifiedShuffleSplit(在sklearn中)每次返回不同的比例,scikit-learn,Scikit Learn,我正在使用sklearn将训练数据拆分为批。这样,我输入NN的每一批都将具有与训练集相同的类比例。或者换句话说,我想在每一批中保留与培训集相同的每个类的百分比 我感到困惑的是,对于每个迭代,每个批都有一点差异。虽然它也有类似的趋势,但它并不遵循训练集的确切百分比。为什么不给出确切的百分比 现在,我自己编写代码,以获得完全相同的百分比。假设您有11个点,并且想要70%的训练集。你得多少分 七点?那么是63.64% 八点?该比率为72.73% StratifiedShuffleSplit有时需要7,

我正在使用sklearn将训练数据拆分为批。这样,我输入NN的每一批都将具有与训练集相同的类比例。或者换句话说,我想在每一批中保留与培训集相同的每个类的百分比

我感到困惑的是,对于每个迭代,每个批都有一点差异。虽然它也有类似的趋势,但它并不遵循训练集的确切百分比。为什么不给出确切的百分比


现在,我自己编写代码,以获得完全相同的百分比。

假设您有11个点,并且想要70%的训练集。你得多少分

七点?那么是63.64%

八点?该比率为72.73%


StratifiedShuffleSplit
有时需要7,有时需要8。因此,每批都有一个小的差异。一切都很好。

谢谢你,拉内诺。当数据或多或少平衡时,就可以了。当数据非常不平衡时,可以用少量的类来消除小干扰。