Deep learning 通过改变随机欠采样来处理数据不平衡问题？_Deep Learning_Imbalanced Data

Deep learning 通过改变随机欠采样来处理数据不平衡问题？

deep-learning

Deep learning 通过改变随机欠采样来处理数据不平衡问题？,deep-learning,imbalanced-data,Deep Learning,Imbalanced Data,我有一个高度不平衡的视频数据，有4个班（2个小班和2个大班）。在每个历元中为每个类传递相同数量的样本是否是一个好主意，但是每个历元中的大多数类样本将不同，而次要类样本将相同。 e、 g.如果我有（10 12 100 90）个班级的样本。假设20*4个样本通过是否可以（小类将过采样，大类将欠采样）？在每一个时代，来自大班的不同样本将用于训练，但小班的样本相同。这对我的训练有什么影响提前感谢。当涉及到高度不平衡的类时，标准的做法是使用分层K折叠，其中您的训练、验证和测试数据集保持每个部分i中所有

我有一个高度不平衡的视频数据，有4个班（2个小班和2个大班）。在每个历元中为每个类传递相同数量的样本是否是一个好主意，但是每个历元中的大多数类样本将不同，而次要类样本将相同。 e、 g.如果我有（10 12 100 90）个班级的样本。假设20*4个样本通过是否可以（小类将过采样，大类将欠采样）？在每一个时代，来自大班的不同样本将用于训练，但小班的样本相同。这对我的训练有什么影响

提前感谢。

当涉及到高度不平衡的类时，标准的做法是使用分层K折叠，其中您的训练、验证和测试数据集保持每个部分i中所有类的分布。e、，如果有90%的正类和10%的负类，则在每个数据集中保持相同的分布。