Computer vision 哪个F1分数用于语义分段任务？_Computer Vision_Semantic Segmentation

Computer vision 哪个F1分数用于语义分段任务？

computer-vision

Computer vision 哪个F1分数用于语义分段任务？,computer-vision,semantic-segmentation,Computer Vision,Semantic Segmentation,我读了一些关于最先进的语义分割模型的文章，在所有这些文章中，作者都使用F1评分标准进行比较，但他们没有写他们使用的是“微观”还是“宏观”版本有人知道用哪一个F1分数来描述分割结果吗？为什么很明显，作者在论文中没有对其进行定义样本文件：只有一个F-1分数——精确性和召回率的调和平均值宏/微/样本/加权/二进制用于多类/多标签目标。如果None，则返回每个类的分数。否则，这将决定对数据执行的平均类型： binary：仅报告pos_标签指定类别的结果。这仅适用于目标（y_{true，pred

我读了一些关于最先进的语义分割模型的文章，在所有这些文章中，作者都使用F1评分标准进行比较，但他们没有写他们使用的是“微观”还是“宏观”版本
有人知道用哪一个F1分数来描述分割结果吗？为什么很明显，作者在论文中没有对其进行定义
样本文件：

只有一个F-1分数——精确性和召回率的调和平均值
宏/微/样本/加权/二进制用于多类/多标签目标。如果
None
，则返回每个类的分数。否则，这将决定对数据执行的平均类型：

binary
：仅报告pos_标签指定类别的结果。这仅适用于目标（y_{true，pred}）是二进制的情况

micro
：通过计算总的真阳性、假阴性和假阳性来全局计算指标

macro
：计算每个标签的指标，并找到它们的未加权平均值。这不考虑标签不平衡

weighted
：计算每个标签的指标，并找到它们的平均加权支持度（每个标签的真实实例数）。这改变了“宏”以解释标签不平衡；它可能导致F分数不在精确度和召回率之间

示例
：计算每个实例的指标，并找到它们的平均值（仅对多标签分类有意义，其中多标签分类与准确度评分不同）

Segnet论文在表5中分别讨论了不同类别的精度。所以我认为他们在这种情况下选择了
None
。
只有一个F1分数。它被定义为精确性和召回率的调和平均值。看见您可能正在考虑不同的方法来计算精确度和召回率？请详细说明你的问题。