Python sklearn log_loss如何知道概率的顺序?
考虑sklearn文档中有关日志丢失的示例:Python sklearn log_loss如何知道概率的顺序?,python,scikit-learn,classification,Python,Scikit Learn,Classification,考虑sklearn文档中有关日志丢失的示例: 从sklearn.metrics导入日志丢失 日志损失([“垃圾邮件”、“火腿”、“火腿”、“垃圾邮件”]、[[1.9]、[9.1]、[8.2]、[35.65]) 运行这个程序,我们得到了~0.216的输出。该模型在火腿和垃圾邮件分类方面相当出色 sklearn如何知道第一种概率是ham,第二种概率是spam 如果我想翻转标签,即第一个是垃圾邮件,第二个是火腿,我该怎么做?显式提供labels参数不起作用: log_损失([“垃圾邮件”、“火腿”、
从sklearn.metrics导入日志丢失
日志损失([“垃圾邮件”、“火腿”、“火腿”、“垃圾邮件”]、[[1.9]、[9.1]、[8.2]、[35.65])
运行这个程序,我们得到了~0.216的输出。该模型在火腿和垃圾邮件分类方面相当出色
sklearn如何知道第一种概率是ham
,第二种概率是spam
如果我想翻转标签,即第一个是垃圾邮件
,第二个是火腿
,我该怎么做?显式提供labels参数不起作用:
log_损失([“垃圾邮件”、“火腿”、“火腿”、“垃圾邮件”]、[[1.9]、[9.1]、[8.2]、[35.65]、标签=[“火腿”、“垃圾邮件”])
产出:0.216
log_损失([“垃圾邮件”、“火腿”、“火腿”、“垃圾邮件”]、[[1.9]、[9.1]、[8.2]、[35.65]、标签=[“垃圾邮件”、“火腿”])
产出:0.216
注意,这不是关于根据的真理标签顺序的问题,而是关于概率顺序的问题。
sklearn.metrics.log\u loss
假设概率标签按字母顺序排列。这一点可以从中看出
要翻转标签,您需要按相反的字母顺序重命名标签,例如aspam
和bham
:
从sklearn.metrics导入日志\u丢失
日志损失([“aspam”、“bham”、“bham”、“aspam”]、[[1.9]、[9.1]、[8.2]、[35.65])
输出:~1.816。在检查相关代码之前先查看源代码,可以说是过火了。