Deep learning 通过改变随机欠采样来处理数据不平衡问题?

Deep learning 通过改变随机欠采样来处理数据不平衡问题?,deep-learning,imbalanced-data,Deep Learning,Imbalanced Data,我有一个高度不平衡的视频数据,有4个班(2个小班和2个大班)。 在每个历元中为每个类传递相同数量的样本是否是一个好主意,但是每个历元中的大多数类样本将不同,而次要类样本将相同。 e、 g.如果我有(10 12 100 90)个班级的样本。假设20*4个样本通过是否可以(小类将过采样,大类将欠采样)?在每一个时代,来自大班的不同样本将用于训练,但小班的样本相同。这对我的训练有什么影响 提前感谢。当涉及到高度不平衡的类时,标准的做法是使用分层K折叠,其中您的训练、验证和测试数据集保持每个部分i中所有

我有一个高度不平衡的视频数据,有4个班(2个小班和2个大班)。 在每个历元中为每个类传递相同数量的样本是否是一个好主意,但是每个历元中的大多数类样本将不同,而次要类样本将相同。 e、 g.如果我有(10 12 100 90)个班级的样本。假设20*4个样本通过是否可以(小类将过采样,大类将欠采样)?在每一个时代,来自大班的不同样本将用于训练,但小班的样本相同。这对我的训练有什么影响


提前感谢。

当涉及到高度不平衡的类时,标准的做法是使用分层K折叠,其中您的训练、验证和测试数据集保持每个部分i中所有类的分布。e、 ,如果有90%的正类和10%的负类,则在每个数据集中保持相同的分布。