Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/visual-studio-2012/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Machine learning onevsrest分类器的损失函数_Machine Learning_Nlp_Scikit Learn - Fatal编程技术网

Machine learning onevsrest分类器的损失函数

Machine learning onevsrest分类器的损失函数,machine-learning,nlp,scikit-learn,Machine Learning,Nlp,Scikit Learn,我有一个经过培训的OneVsRestClassifier(scikit learn) clf = OneVsRestClassifier(LogisticRegression(C=1.2, penalty='l1')).fit(X_train, y_train) 我想找出我的测试数据丢失的原因。我使用了log\u loss函数,但它似乎不起作用,因为我有多个类作为每个测试用例的输出。我该怎么办 您所指的分类问题称为问题。为此,您已经做出了使用OneVsRestClassifier的好决定。默认

我有一个经过培训的
OneVsRestClassifier
scikit learn

clf = OneVsRestClassifier(LogisticRegression(C=1.2, penalty='l1')).fit(X_train, y_train)

我想找出我的测试数据丢失的原因。我使用了
log\u loss
函数,但它似乎不起作用,因为我有多个类作为每个测试用例的输出。我该怎么办

您所指的分类问题称为问题。为此,您已经做出了使用
OneVsRestClassifier
的好决定。默认情况下,该方法使用子集精度,这是一个非常苛刻的指标,因为它要求您正确猜测标签的整个子集

scikit learn提供的一些其他损失函数可供使用,如下所示:

  • -这测量了预测标签与真实标签之间的汉明距离。是理解汉明距离的直观公式
  • -这测量预测标签和真实标签之间的相似性
  • -在多标签分类的情况下,精确度、召回率和F-度量的概念可独立应用于每个类别。说明了如何在多标签分类中跨所有标签组合它们
  • 如果您还需要像在多标签排序问题中那样对标签进行排序,那么scikit learn中还提供了其他更高级的技术,这些技术都有很好的示例文档记录。如果您正在处理此类问题,请在评论中告诉我,我将更详细地解释这些指标


    希望这有帮助

    你的数据有多大?你使用的是哪一个数据集?我使用的是来自ntlk.corpus的“路透社”数据集。总共大约有10000份文件。我很高兴它对你有用。如果这对您有帮助,请您将其标记为已接受的答案,好吗?这也将帮助其他有同样疑问的人。非常感谢。