Python SciKit学习列车试验分流不平衡

Python SciKit学习列车试验分流不平衡,python,scikit-learn,Python,Scikit Learn,我正在尝试训练一个分类模型,在我的train_测试中,我发现了严重的不平衡。我尝试了几种不同的随机状态。我的整个样本有一个分类:24/19/57。肯定存在不平衡,但当我进行列车测试分割时,我最终会出现以下故障:5/0.1/94.9。有人知道为什么会发生这种情况吗 这是我的 Text_train, Text_test, label_train, label_test = \ train_test_split(X, y, test_size=0.25, random_state = 42) 有什么

我正在尝试训练一个分类模型,在我的train_测试中,我发现了严重的不平衡。我尝试了几种不同的随机状态。我的整个样本有一个分类:
24/19/57
。肯定存在不平衡,但当我进行列车测试分割时,我最终会出现以下故障:
5/0.1/94.9
。有人知道为什么会发生这种情况吗

这是我的

Text_train, Text_test, label_train, label_test = \
train_test_split(X, y, test_size=0.25, random_state = 42)

有什么想法吗

可复制的例子?这是我从中得到的混淆矩阵:[[1586421633][132320][11101953629860]]这是基于50676/39900/122193的基数。可复制意味着其他人可以运行。我不能运行你的混乱矩阵。在一个由100000个元素组成的数据集上,我几乎完全被分割了。我不知道你还想要什么。我给了你复制数据集所需的一切。我给了你标签/DV的分类和我的火车测试代码。你没有这个问题。我只是想知道为什么会发生在我身上。
Text\u train,Text\u test,label\u train,label\u test=train\u test\u split(X,y,test\u size=0.25,random\u state=42,stratify=y)