Python-如何在使用分类机制之前平衡类？_Python_Machine Learning

Python-如何在使用分类机制之前平衡类？

python machine-learning

Python-如何在使用分类机制之前平衡类？,python,machine-learning,Python,Machine Learning,我有一个不平衡类的数据集。使用“sklearn.StratifiedKFold”分割数据，然后使用各种分类方法进行测试。结果不是很好，可能是因为班级不平衡我以前没有找到用于平衡类的库或方法。要帮忙吗？非常感谢。这里是一个很好的答案和教程：技术说明： 1.向上抽样的少数民族阶级上采样是随机复制少数群体的观察结果以增强其信号的过程有几种启发式方法可以做到这一点，但最常见的方法是简单地用替换重新采样首先，我们将把每个类的观察结果分成不同的数据帧接下来，我们将使用replacement对

我有一个不平衡类的数据集。使用“sklearn.StratifiedKFold”分割数据，然后使用各种分类方法进行测试。结果不是很好，可能是因为班级不平衡

我以前没有找到用于平衡类的库或方法。要帮忙吗？非常感谢。

这里是一个很好的答案和教程：

技术说明： 1.向上抽样的少数民族阶级上采样是随机复制少数群体的观察结果以增强其信号的过程

有几种启发式方法可以做到这一点，但最常见的方法是简单地用替换重新采样

首先，我们将把每个类的观察结果分成不同的数据帧
接下来，我们将使用replacement对少数类重新采样，将采样数设置为与多数类的采样数匹配
最后，我们将结合上采样的少数类数据帧和原始多数类数据帧
下样本多数类下采样包括从多数类中随机移除观测值，以防止其信号支配学习算法

最常见的启发式方法是不替换地重新采样。该过程类似于上采样过程。以下是步骤：

首先，我们将每个类的观察结果分成不同的类别数据帧。
- 接下来，我们将在不替换的情况下对多数类重新采样，将采样数设置为与少数类的采样数匹配
- 最后，我们将组合下采样的多数类数据帧和原始少数类数据帧