Machine learning onevsrest分类器的损失函数_Machine Learning_Nlp_Scikit Learn

Machine learning onevsrest分类器的损失函数

machine-learning nlp scikit-learn

Machine learning onevsrest分类器的损失函数,machine-learning,nlp,scikit-learn,Machine Learning,Nlp,Scikit Learn,我有一个经过培训的OneVsRestClassifier（scikit learn） clf = OneVsRestClassifier(LogisticRegression(C=1.2, penalty='l1')).fit(X_train, y_train) 我想找出我的测试数据丢失的原因。我使用了log\u loss函数，但它似乎不起作用，因为我有多个类作为每个测试用例的输出。我该怎么办您所指的分类问题称为问题。为此，您已经做出了使用OneVsRestClassifier的好决定。默认

我有一个经过培训的

OneVsRestClassifier

（

scikit learn

）

clf = OneVsRestClassifier(LogisticRegression(C=1.2, penalty='l1')).fit(X_train, y_train)

我想找出我的测试数据丢失的原因。我使用了

log\u loss

函数，但它似乎不起作用，因为我有多个类作为每个测试用例的输出。我该怎么办

您所指的分类问题称为问题。为此，您已经做出了使用

OneVsRestClassifier

的好决定。默认情况下，该方法使用子集精度，这是一个非常苛刻的指标，因为它要求您正确猜测标签的整个子集

scikit learn提供的一些其他损失函数可供使用，如下所示：

-这测量了预测标签与真实标签之间的汉明距离。是理解汉明距离的直观公式

-这测量预测标签和真实标签之间的相似性

-在多标签分类的情况下，精确度、召回率和F-度量的概念可独立应用于每个类别。说明了如何在多标签分类中跨所有标签组合它们

如果您还需要像在多标签排序问题中那样对标签进行排序，那么scikit learn中还提供了其他更高级的技术，这些技术都有很好的示例文档记录。如果您正在处理此类问题，请在评论中告诉我，我将更详细地解释这些指标

希望这有帮助

你的数据有多大？你使用的是哪一个数据集？我使用的是来自ntlk.corpus的“路透社”数据集。总共大约有10000份文件。我很高兴它对你有用。如果这对您有帮助，请您将其标记为已接受的答案，好吗？这也将帮助其他有同样疑问的人。非常感谢。