Scikit learn StratifiedShuffleSplit（在sklearn中）每次返回不同的比例_Scikit Learn

Scikit learn StratifiedShuffleSplit（在sklearn中）每次返回不同的比例

scikit-learn

Scikit learn StratifiedShuffleSplit（在sklearn中）每次返回不同的比例,scikit-learn,Scikit Learn,我正在使用sklearn将训练数据拆分为批。这样，我输入NN的每一批都将具有与训练集相同的类比例。或者换句话说，我想在每一批中保留与培训集相同的每个类的百分比我感到困惑的是，对于每个迭代，每个批都有一点差异。虽然它也有类似的趋势，但它并不遵循训练集的确切百分比。为什么不给出确切的百分比现在，我自己编写代码，以获得完全相同的百分比。假设您有11个点，并且想要70%的训练集。你得多少分七点？那么是63.64% 八点？该比率为72.73% StratifiedShuffleSplit有时需要7，

我正在使用sklearn将训练数据拆分为批。这样，我输入NN的每一批都将具有与训练集相同的类比例。或者换句话说，我想在每一批中保留与培训集相同的每个类的百分比

我感到困惑的是，对于每个迭代，每个批都有一点差异。虽然它也有类似的趋势，但它并不遵循训练集的确切百分比。为什么不给出确切的百分比

现在，我自己编写代码，以获得完全相同的百分比。

假设您有11个点，并且想要70%的训练集。你得多少分

七点？那么是63.64%

八点？该比率为72.73%

StratifiedShuffleSplit

有时需要7，有时需要8。因此，每批都有一个小的差异。一切都很好。

谢谢你，拉内诺。当数据或多或少平衡时，就可以了。当数据非常不平衡时，可以用少量的类来消除小干扰。