是否有Python函数允许对不平衡的多类数据集进行重采样?
我想在多类数据集上训练卷积神经网络(CNN)。阶级不平衡,所以我想对少数民族阶级进行抽样调查 数据集如下所示:是否有Python函数允许对不平衡的多类数据集进行重采样?,python,scikit-learn,resampling,Python,Scikit Learn,Resampling,我想在多类数据集上训练卷积神经网络(CNN)。阶级不平衡,所以我想对少数民族阶级进行抽样调查 数据集如下所示: [Text 1, ["obscene", "insult"]], [Text 2, ["identity_attack", "insult"]] 我试图使用sklearn.utils中的重采样功能。问题是,如果我通过创建文本1的副本来增加猥亵类的采样,我也会自动增加侮辱类的采样 有没有一个Python函数
[Text 1, ["obscene", "insult"]],
[Text 2, ["identity_attack", "insult"]]
我试图使用sklearn.utils
中的重采样功能。问题是,如果我通过创建文本1的副本来增加猥亵类的采样,我也会自动增加侮辱类的采样
有没有一个Python函数可以解决我的问题?您只能对选定的类使用增强功能我有一个函数可以实现这一点。