Python scikit学习类子集的度量_Python_Machine Learning_Scikit Learn

Python scikit学习类子集的度量

python machine-learning scikit-learn

Python scikit学习类子集的度量,python,machine-learning,scikit-learn,Python,Machine Learning,Scikit Learn,我们在9个班和一个特殊的“其他”班上使用了scikit learn==0.15.2和培训LinearSVC。“others”类在我们的数据集中包含任何不适合我们试图分类的9个重要类的内容我们希望只获得9个类的平均微观/宏观精度/召回率/f1指标，而不包括“其他”类，以便对我们的分类器进行性能评估我们在内置的scikitmetrics函数中找不到对此的任何支持。即使是classification\u report函数在试图将标签限制为仅9（）时也存在问题缺乏支持是否表明我们的基本方法不正确？

我们在9个班和一个特殊的“其他”班上使用了

scikit learn==0.15.2

和培训

LinearSVC

。“others”类在我们的数据集中包含任何不适合我们试图分类的9个重要类的内容

我们希望只获得9个类的平均微观/宏观精度/召回率/f1指标，而不包括“其他”类，以便对我们的分类器进行性能评估

我们在内置的scikit

metrics

函数中找不到对此的任何支持。即使是

classification\u report

函数在试图将标签限制为仅9（）时也存在问题

缺乏支持是否表明我们的基本方法不正确？我们在衡量绩效时是否应该包括“其他人”

编辑：请注意，我们的消费者仅在预测9类中的一类时使用我们的预测。如果我们预测“其他人”，我们的产出就会被扔掉，使用另一个模型

简言之是的，您应该包括每个类。为什么你会忽略（可能是最大的）类？即使只是噪声，分类器性能的基本要求是能够将噪声与重要类别区分开来。有些情况下，您可能对“其他”类不感兴趣（在误报不相关的情况下），但这些情况非常罕见，因此无法直接在scikit learn的度量模块中实现。
简言之是的，您应该包括每个类。为什么你会忽略（可能是最大的）类？即使只是噪声，分类器性能的基本要求是能够将噪声与重要类别区分开来。有些情况下，您可能对“其他”类不感兴趣（在误报不相关的情况下），但这些情况非常罕见，因此无法直接在scikit learn的度量模块中实现。
简言之是的，您应该包括每个类。为什么你会忽略（可能是最大的）类？即使只是噪声，分类器性能的基本要求是能够将噪声与重要类别区分开来。有些情况下，您可能对“其他”类不感兴趣（在误报不相关的情况下），但这些情况非常罕见，因此无法直接在scikit learn的度量模块中实现。
简言之是的，您应该包括每个类。为什么你会忽略（可能是最大的）类？即使只是噪声，分类器性能的基本要求是能够将噪声与重要类别区分开来。有些情况下，您可能对“其他”类不感兴趣（在误报不相关的情况下），但这些情况非常罕见，因此无法直接在scikit learn的度量模块中实现。
为什么不使用混淆矩阵

基于该矩阵，您可以创建自己的指标
为什么不使用混淆矩阵

基于该矩阵，您可以创建自己的指标
为什么不使用混淆矩阵

基于该矩阵，您可以创建自己的指标
为什么不使用混淆矩阵
基于该矩阵，您可以创建自己的度量