Scikit learn train_test_split函数是否保持了类之间的平衡

Scikit learn train_test_split函数是否保持了类之间的平衡,scikit-learn,Scikit Learn,我有一个问题,我一直在寻找答案,但我找不到答案 如果我有一个使用三个或更多类标记的数据集,其中每个类代表33%的数据。当我分割数据时,培训/验证/测试集是否在类之间保持相同的平衡 如果没有,有没有办法保持平衡 提前谢谢。找到了 X\u-train,X\u-test,y\u-train,y\u-test=train\u-test\u-split(X,y,test\u-size=0.2,random\u-state=42,stratify=y)这有什么可能的重复?它将列/测试集中的数据分层,并保持类

我有一个问题,我一直在寻找答案,但我找不到答案

如果我有一个使用三个或更多类标记的数据集,其中每个类代表33%的数据。当我分割数据时,培训/验证/测试集是否在类之间保持相同的平衡

如果没有,有没有办法保持平衡

提前谢谢。

找到了


X\u-train,X\u-test,y\u-train,y\u-test=train\u-test\u-split(X,y,test\u-size=0.2,random\u-state=42,stratify=y)

这有什么可能的重复?它将列/测试集中的数据分层,并保持类的数量平衡,例如如果你有100个1类和100个2类,当您使用0.2测试大小进行拆分时,您将得到一个包含80个class1和80个class2的训练集,以及一个包含20个class1和20个class2的测试集