Python scikit学习类子集的度量
我们在9个班和一个特殊的“其他”班上使用了Python scikit学习类子集的度量,python,machine-learning,scikit-learn,Python,Machine Learning,Scikit Learn,我们在9个班和一个特殊的“其他”班上使用了scikit learn==0.15.2和培训LinearSVC。“others”类在我们的数据集中包含任何不适合我们试图分类的9个重要类的内容 我们希望只获得9个类的平均微观/宏观精度/召回率/f1指标,而不包括“其他”类,以便对我们的分类器进行性能评估 我们在内置的scikitmetrics函数中找不到对此的任何支持。即使是classification\u report函数在试图将标签限制为仅9()时也存在问题 缺乏支持是否表明我们的基本方法不正确?
scikit learn==0.15.2
和培训LinearSVC
。“others”类在我们的数据集中包含任何不适合我们试图分类的9个重要类的内容
我们希望只获得9个类的平均微观/宏观精度/召回率/f1指标,而不包括“其他”类,以便对我们的分类器进行性能评估
我们在内置的scikitmetrics
函数中找不到对此的任何支持。即使是classification\u report
函数在试图将标签限制为仅9()时也存在问题
缺乏支持是否表明我们的基本方法不正确?我们在衡量绩效时是否应该包括“其他人”
编辑:请注意,我们的消费者仅在预测9类中的一类时使用我们的预测。如果我们预测“其他人”,我们的产出就会被扔掉,使用另一个模型 简言之是的,您应该包括每个类。为什么你会忽略(可能是最大的)类?即使只是噪声,分类器性能的基本要求是能够将噪声与重要类别区分开来。有些情况下,您可能对“其他”类不感兴趣(在误报不相关的情况下),但这些情况非常罕见,因此无法直接在scikit learn的度量模块中实现。简言之是的,您应该包括每个类。为什么你会忽略(可能是最大的)类?即使只是噪声,分类器性能的基本要求是能够将噪声与重要类别区分开来。有些情况下,您可能对“其他”类不感兴趣(在误报不相关的情况下),但这些情况非常罕见,因此无法直接在scikit learn的度量模块中实现。简言之是的,您应该包括每个类。为什么你会忽略(可能是最大的)类?即使只是噪声,分类器性能的基本要求是能够将噪声与重要类别区分开来。有些情况下,您可能对“其他”类不感兴趣(在误报不相关的情况下),但这些情况非常罕见,因此无法直接在scikit learn的度量模块中实现。简言之是的,您应该包括每个类。为什么你会忽略(可能是最大的)类?即使只是噪声,分类器性能的基本要求是能够将噪声与重要类别区分开来。有些情况下,您可能对“其他”类不感兴趣(在误报不相关的情况下),但这些情况非常罕见,因此无法直接在scikit learn的度量模块中实现。为什么不使用混淆矩阵
基于该矩阵,您可以创建自己的指标为什么不使用混淆矩阵
基于该矩阵,您可以创建自己的指标为什么不使用混淆矩阵
基于该矩阵,您可以创建自己的指标为什么不使用混淆矩阵 基于该矩阵,您可以创建自己的度量