Python 对label powerset和RakelD模型输出的解释
我正在为一个有33个标签的数据集进行多标签分类任务 我想预测不同标签组合的实例概率。 我运行与此类任务相关的scikit multilearn软件包中的Label Powerset()和RakelD()模型 我得到了一个稀疏矩阵的输出,其大小为测试集样本数X标签数,因此似乎我得到了每个标签的预测分数,而不是每个标签组合的预测分数。 我不确定我做错了什么——我是否误解了?还是我用错了 这是相关的代码行:Python 对label powerset和RakelD模型输出的解释,python,machine-learning,multilabel-classification,powerset,scikit-multilearn,Python,Machine Learning,Multilabel Classification,Powerset,Scikit Multilearn,我正在为一个有33个标签的数据集进行多标签分类任务 我想预测不同标签组合的实例概率。 我运行与此类任务相关的scikit multilearn软件包中的Label Powerset()和RakelD()模型 我得到了一个稀疏矩阵的输出,其大小为测试集样本数X标签数,因此似乎我得到了每个标签的预测分数,而不是每个标签组合的预测分数。 我不确定我做错了什么——我是否误解了?还是我用错了 这是相关的代码行: classifier = RakelD( base_classifier=GaussianNB
classifier = RakelD(
base_classifier=GaussianNB(),
base_classifier_require_dense=[True, True],
labelset_size=4
)
classifier.fit(X_train, y_train)
predictions = classifier.predict_proba(X_test)
而且
classifier = LabelPowerset(LogisticRegression(max_iter=1000))
classifier.fit(X_train, y_train)
predictions = classifier.predict_proba(X_test)
这只是输出的一部分(1727是测试集样本数,33是标签数)
任何帮助都将不胜感激
(1727, 24) 4.448848136222317e-17
(1727, 25) 0.9999999999999716
(1727, 26) 8.88216696887196e-23
(1727, 27) 9.592208368406972e-23
(1727, 28) 0.9997353073474586
(1727, 29) 2.9735581432191686e-12
(1727, 30) 2.445564006803013e-40
(1727, 31) 8.208621013012522e-33
(1727, 32) 0.9999999993735122