Keras 如何确定不平衡数据集的类权重
我正在处理一个不平衡的数据集。我正试图在Keras 如何确定不平衡数据集的类权重,keras,data-science,imbalanced-data,Keras,Data Science,Imbalanced Data,我正在处理一个不平衡的数据集。我正试图在类权重的帮助下构建模型。那么,我可以根据什么来确定类的权重 标签及其计数如下所示: label Count 2 47213 3 2096 4 2021 1 737 0 176 那么,我应该为class\u权重变量提供什么值: model.fit(X\u-train,Y\u-train,nb\u-epoch=5,批量大小=32,等级重量=class\u-weight)您可以使用计算
类权重的帮助下构建模型。那么,我可以根据什么来确定类的权重
标签及其计数如下所示:
label Count
2 47213
3 2096
4 2021
1 737
0 176
那么,我应该为class\u权重
变量提供什么值:
model.fit(X\u-train,Y\u-train,nb\u-epoch=5,批量大小=32,等级重量=class\u-weight)
您可以使用计算等级重量从sklearn
中进行此操作
from sklearn.utils import compute_class_weight
class_weights = compute_class_weight("balanced", np.unique(Y_train), Y_train)