Statistics 如何α；值是在katz回退语言模型中计算的？_Statistics_Nlp_Probability_N Gram

Statistics 如何α；值是在katz回退语言模型中计算的？

statistics nlp

Statistics 如何α；值是在katz回退语言模型中计算的？,statistics,nlp,probability,n-gram,Statistics,Nlp,Probability,N Gram,我目前正在为katz回退平滑语言模型的实现工作。我对递归退避和α计算的低阶模型有些困惑。假设三元图的卡茨模型如下所示 Pkatz（wi | wi-2wi-1）=p（wi | wi-2wi-1），如果C（wi-2wi-1wi）>0或α1P（wi | wi-1），如果C（wi-2wi-1wi）=0和C（wi 1wi）>0或α2P（wi），则相反我也知道二元图的α1是从三元图模型中得到的折扣计算出来的，但我的困惑是它是如何计算低阶单元图的α2的。如果trigram和bigram案例都没有证据，它是使

我目前正在为katz回退平滑语言模型的实现工作。我对递归退避和α计算的低阶模型有些困惑。假设三元图的卡茨模型如下所示

Pkatz（wi | wi-2wi-1）=p（wi | wi-2wi-1），如果C（wi-2wi-1wi）>0
或α1P（wi | wi-1），如果C（wi-2wi-1wi）=0和C（wi 1wi）>0
或α2P（wi），则相反

我也知道二元图的α1是从三元图模型中得到的折扣计算出来的，但我的困惑是它是如何计算低阶单元图的α2的。如果trigram和bigram案例都没有证据，它是使用trigram模型的折扣还是使用bigram模型的折扣

基本上，α是基于“缺失概率质量”。阿尔法是为了确保包括退避在内的ngram模型的概率总和等于1

所以对于你的问题，如果你在二元图中有折扣，就会有一些遗漏的概率。我想你需要使用1-三元概率之和-α*二元概率之和来找到下一个单格的α

基本上，α是基于“缺失概率质量”。阿尔法是为了确保包括退避在内的ngram模型的概率总和等于1

所以对于你的问题，如果你在二元图中有折扣，就会有一些遗漏的概率。我想你需要使用1-三元概率之和-α*二元概率之和来找到下一个单格的α

它要么在ngram的所有级别上使用固定折扣，要么在每个级别上使用特定折扣。我不知道确切的答案，但我相信你可以在古德曼和陈的论文（第6页）中找到：亲爱的用户3639557，非常感谢你的建议。我已经阅读了chen和goodman的论文，但我仍然对katz回退的递归实现和α2参数的计算感到困惑。我需要具体的解决方案。它要么在所有级别的ngram中使用固定折扣，要么对每个级别使用特定折扣。我不知道确切的答案，但我相信你可以在古德曼和陈的论文（第6页）中找到：亲爱的用户3639557，非常感谢你的建议。我已经阅读了chen和goodman的论文，但我仍然对katz回退的递归实现和α2参数的计算感到困惑。我需要具体的解决办法。