Keras 模型评估指标中的Bleu分数

Keras 模型评估指标中的Bleu分数,keras,seq2seq,bleu,Keras,Seq2seq,Bleu,在许多seq2seq实现中,我看到它们在编译模型时使用精度度量,而在预测中只使用Bleu分数 为什么他们不在训练中使用Bleu分数来提高效率?如果我理解正确的话 双语评估替补得分是为了取代人类,因此替补这个词出现在它的名字中 现在,当您在训练数据时,您已经有了目标值,可以直接将生成的输出与之进行比较,但是当您在数据集上进行预测时,您无法衡量您翻译的句子是否正确。这就是为什么要使用Bleu,因为没有人可以在每次机器翻译后检查您的预测是否正确,Bleu提供了一个健全的检查 p.S.替补意味着有人向导

在许多seq2seq实现中,我看到它们在编译模型时使用精度度量,而在预测中只使用Bleu分数


为什么他们不在训练中使用Bleu分数来提高效率?如果我理解正确的话

双语评估替补得分是为了取代人类,因此替补这个词出现在它的名字中

现在,当您在训练数据时,您已经有了目标值,可以直接将生成的输出与之进行比较,但是当您在数据集上进行预测时,您无法衡量您翻译的句子是否正确。这就是为什么要使用Bleu,因为没有人可以在每次机器翻译后检查您的预测是否正确,Bleu提供了一个健全的检查

p.S.替补意味着有人向导师学习,在必要时取代他。布鲁向人类学习,然后能够为翻译打分

如需进一步参考,请查看


如果有任何疑问,请在下面进行评论。

替补不是培训期间未报告指标的主要原因。当参考(即地面真相文本)可用时,您可以随时计算度量。主要原因是这些度量是基于整个语料库的,并且频繁地计算这些度量既慢又耗时。