Python-如何在使用分类机制之前平衡类?
我有一个不平衡类的数据集。使用“sklearn.StratifiedKFold”分割数据,然后使用各种分类方法进行测试。结果不是很好,可能是因为班级不平衡Python-如何在使用分类机制之前平衡类?,python,machine-learning,Python,Machine Learning,我有一个不平衡类的数据集。使用“sklearn.StratifiedKFold”分割数据,然后使用各种分类方法进行测试。结果不是很好,可能是因为班级不平衡 我以前没有找到用于平衡类的库或方法。要帮忙吗?非常感谢。这里是一个很好的答案和教程: 技术说明: 1.向上抽样的少数民族阶级 上采样是随机复制少数群体的观察结果以增强其信号的过程 有几种启发式方法可以做到这一点,但最常见的方法是简单地用替换重新采样 首先,我们将把每个类的观察结果分成不同的数据帧 接下来,我们将使用replacement对
我以前没有找到用于平衡类的库或方法。要帮忙吗?非常感谢。这里是一个很好的答案和教程: 技术说明: 1.向上抽样的少数民族阶级 上采样是随机复制少数群体的观察结果以增强其信号的过程 有几种启发式方法可以做到这一点,但最常见的方法是简单地用替换重新采样
- 首先,我们将把每个类的观察结果分成不同的数据帧
- 接下来,我们将使用replacement对少数类重新采样,将采样数设置为与多数类的采样数匹配
- 最后,我们将结合上采样的少数类数据帧和原始多数类数据帧
- 下样本多数类 下采样包括从多数类中随机移除观测值,以防止其信号支配学习算法
- 首先,我们将每个类的观察结果分成不同的类别
数据帧。
- 接下来,我们将在不替换的情况下对多数类重新采样,将采样数设置为与少数类的采样数匹配
- 最后,我们将组合下采样的多数类数据帧和原始少数类数据帧