Machine learning BLEU评分的变化

Machine learning BLEU评分的变化,machine-learning,translation,metrics,evaluation,bleu,Machine Learning,Translation,Metrics,Evaluation,Bleu,我对机器翻译的蓝色分数计算有一些问题。我意识到他们可能对BLEU有不同的衡量标准。我发现代码报告了BLEU的五个值,即BLEU-1、BLEU-2、BLEU-3、BLEU-4和最终BLEU,这似乎是前四个BLEU的指数平均值。我仍然不清楚这两者之间的区别。你有什么想法吗?谢谢 首先,我认为这更多的是一个理论内容,并将其发布在meta stackexange上。主持人已将其关闭并评论为stackoverflow类型的问题。所以请不要再惩罚我了 来源: 我没听说过BLEU-1和BLEU-2,但我猜它在

我对机器翻译的蓝色分数计算有一些问题。我意识到他们可能对BLEU有不同的衡量标准。我发现代码报告了BLEU的五个值,即BLEU-1、BLEU-2、BLEU-3、BLEU-4和最终BLEU,这似乎是前四个BLEU的指数平均值。我仍然不清楚这两者之间的区别。你有什么想法吗?谢谢

首先,我认为这更多的是一个理论内容,并将其发布在meta stackexange上。主持人已将其关闭并评论为stackoverflow类型的问题。所以请不要再惩罚我了

来源:

我没听说过BLEU-1和BLEU-2,但我猜它在BLEU分数公式中的意思是1克、2克、3克和4克,我的意思是在你的问题中的公式
precision[I]=BLEU-I


事实上,BLEU-n不仅仅使用n-gram分数。它计算1-gram到n-gram的分数,并赋予它们相等的权重以计算最终分数。有关更多信息,请参阅的“累积N-Gram分数”部分