Computer vision 哪个F1分数用于语义分段任务?

Computer vision 哪个F1分数用于语义分段任务?,computer-vision,semantic-segmentation,Computer Vision,Semantic Segmentation,我读了一些关于最先进的语义分割模型的文章,在所有这些文章中,作者都使用F1评分标准进行比较,但他们没有写他们使用的是“微观”还是“宏观”版本 有人知道用哪一个F1分数来描述分割结果吗?为什么很明显,作者在论文中没有对其进行定义 样本文件: 只有一个F-1分数——精确性和召回率的调和平均值 宏/微/样本/加权/二进制用于多类/多标签目标。如果None,则返回每个类的分数。否则,这将决定对数据执行的平均类型: binary:仅报告pos_标签指定类别的结果。这仅适用于目标(y_{true,pred

我读了一些关于最先进的语义分割模型的文章,在所有这些文章中,作者都使用F1评分标准进行比较,但他们没有写他们使用的是“微观”还是“宏观”版本

有人知道用哪一个F1分数来描述分割结果吗?为什么很明显,作者在论文中没有对其进行定义

样本文件:


只有一个F-1分数——精确性和召回率的调和平均值

宏/微/样本/加权/二进制用于多类/多标签目标。如果
None
,则返回每个类的分数。否则,这将决定对数据执行的平均类型:

binary
:仅报告pos_标签指定类别的结果。这仅适用于目标(y_{true,pred})是二进制的情况

micro
:通过计算总的真阳性、假阴性和假阳性来全局计算指标

macro
:计算每个标签的指标,并找到它们的未加权平均值。这不考虑标签不平衡

weighted
:计算每个标签的指标,并找到它们的平均加权支持度(每个标签的真实实例数)。这改变了“宏”以解释标签不平衡;它可能导致F分数不在精确度和召回率之间

示例
:计算每个实例的指标,并找到它们的平均值(仅对多标签分类有意义,其中多标签分类与准确度评分不同)


Segnet论文在表5中分别讨论了不同类别的精度。所以我认为他们在这种情况下选择了
None

只有一个F1分数。它被定义为精确性和召回率的调和平均值。看见您可能正在考虑不同的方法来计算精确度和召回率?请详细说明你的问题。