Python-如何在使用分类机制之前平衡类?

Python-如何在使用分类机制之前平衡类?,python,machine-learning,Python,Machine Learning,我有一个不平衡类的数据集。使用“sklearn.StratifiedKFold”分割数据,然后使用各种分类方法进行测试。结果不是很好,可能是因为班级不平衡 我以前没有找到用于平衡类的库或方法。要帮忙吗?非常感谢。这里是一个很好的答案和教程: 技术说明: 1.向上抽样的少数民族阶级 上采样是随机复制少数群体的观察结果以增强其信号的过程 有几种启发式方法可以做到这一点,但最常见的方法是简单地用替换重新采样 首先,我们将把每个类的观察结果分成不同的数据帧 接下来,我们将使用replacement对

我有一个不平衡类的数据集。使用“sklearn.StratifiedKFold”分割数据,然后使用各种分类方法进行测试。结果不是很好,可能是因为班级不平衡


我以前没有找到用于平衡类的库或方法。要帮忙吗?非常感谢。

这里是一个很好的答案和教程:

技术说明: 1.向上抽样的少数民族阶级 上采样是随机复制少数群体的观察结果以增强其信号的过程

有几种启发式方法可以做到这一点,但最常见的方法是简单地用替换重新采样

  • 首先,我们将把每个类的观察结果分成不同的数据帧
  • 接下来,我们将使用replacement对少数类重新采样,将采样数设置为与多数类的采样数匹配
  • 最后,我们将结合上采样的少数类数据帧和原始多数类数据帧

  • 下样本多数类 下采样包括从多数类中随机移除观测值,以防止其信号支配学习算法
最常见的启发式方法是不替换地重新采样。 该过程类似于上采样过程。以下是步骤:

  • 首先,我们将每个类的观察结果分成不同的类别 数据帧。
    • 接下来,我们将在不替换的情况下对多数类重新采样,将采样数设置为与少数类的采样数匹配
    • 最后,我们将组合下采样的多数类数据帧和原始少数类数据帧