Statistics 如何α;值是在katz回退语言模型中计算的?

Statistics 如何α;值是在katz回退语言模型中计算的?,statistics,nlp,probability,n-gram,Statistics,Nlp,Probability,N Gram,我目前正在为katz回退平滑语言模型的实现工作。我对递归退避和α计算的低阶模型有些困惑。假设三元图的卡茨模型如下所示 Pkatz(wi | wi-2wi-1)=p(wi | wi-2wi-1),如果C(wi-2wi-1wi)>0或α1P(wi | wi-1),如果C(wi-2wi-1wi)=0和C(wi 1wi)>0或α2P(wi),则相反 我也知道二元图的α1是从三元图模型中得到的折扣计算出来的,但我的困惑是它是如何计算低阶单元图的α2的。如果trigram和bigram案例都没有证据,它是使

我目前正在为katz回退平滑语言模型的实现工作。我对递归退避和α计算的低阶模型有些困惑。假设三元图的卡茨模型如下所示

Pkatz(wi | wi-2wi-1)=p(wi | wi-2wi-1),如果C(wi-2wi-1wi)>0
或α1P(wi | wi-1),如果C(wi-2wi-1wi)=0和C(wi 1wi)>0
或α2P(wi),则相反


我也知道二元图的α1是从三元图模型中得到的折扣计算出来的,但我的困惑是它是如何计算低阶单元图的α2的。如果trigram和bigram案例都没有证据,它是使用trigram模型的折扣还是使用bigram模型的折扣

基本上,α是基于“缺失概率质量”。阿尔法是为了确保包括退避在内的ngram模型的概率总和等于1


所以对于你的问题,如果你在二元图中有折扣,就会有一些遗漏的概率。我想你需要使用1-三元概率之和-α*二元概率之和来找到下一个单格的α

基本上,α是基于“缺失概率质量”。阿尔法是为了确保包括退避在内的ngram模型的概率总和等于1


所以对于你的问题,如果你在二元图中有折扣,就会有一些遗漏的概率。我想你需要使用1-三元概率之和-α*二元概率之和来找到下一个单格的α

它要么在ngram的所有级别上使用固定折扣,要么在每个级别上使用特定折扣。我不知道确切的答案,但我相信你可以在古德曼和陈的论文(第6页)中找到:亲爱的用户3639557,非常感谢你的建议。我已经阅读了chen和goodman的论文,但我仍然对katz回退的递归实现和α2参数的计算感到困惑。我需要具体的解决方案。它要么在所有级别的ngram中使用固定折扣,要么对每个级别使用特定折扣。我不知道确切的答案,但我相信你可以在古德曼和陈的论文(第6页)中找到:亲爱的用户3639557,非常感谢你的建议。我已经阅读了chen和goodman的论文,但我仍然对katz回退的递归实现和α2参数的计算感到困惑。我需要具体的解决办法。