如何理解用于评估标记的脚本conlleval.perl?

如何理解用于评估标记的脚本conlleval.perl?,perl,sequence,precision,tagging,Perl,Sequence,Precision,Tagging,我总是不知道如何评估标记任务,包括词性标记或任何其他序列标记。我尤其不知道如何计算这些任务的准确度、召回率和F1分数。 然后我发现有一个名为conlleval.perl的脚本,我们可以直接使用它进行计算。但我不懂perl语言,我仍然不知道在标记任务中P、R、F1是如何计算的。 有人能告诉我吗?在《口语理解:从语音中提取语义信息的系统》(作者Gokhan Tur,Renato De Mori)一书中有一个简单的定义: 精度=#SLU正确检测到的参考插槽/#SLU检测到的总插槽 召回率=#由SLU正

我总是不知道如何评估标记任务,包括词性标记或任何其他序列标记。我尤其不知道如何计算这些任务的准确度、召回率和F1分数。 然后我发现有一个名为conlleval.perl的脚本,我们可以直接使用它进行计算。但我不懂perl语言,我仍然不知道在标记任务中P、R、F1是如何计算的。
有人能告诉我吗?

在《口语理解:从语音中提取语义信息的系统》(作者Gokhan Tur,Renato De Mori)一书中有一个简单的定义:

精度=#SLU正确检测到的参考插槽/#SLU检测到的总插槽

召回率=#由SLU正确检测到的参考插槽数/#总参考插槽数

F1=2 x精度x召回/(精度+召回)


注意:对于conlleval使用的总体指标。

这里有问题吗?也许如果你展示一些代码,代码中没有问题。在评估B-I-O序列标记时,我不知道如何理解精度、召回率和F1分数的计算。也许是脚本的链接?否则,就没有办法为您澄清计算结果。哦,对不起。这里有一个链接。你需要知道使用的公式吗?还是动机?