Nlp 什么是;字数“;在单语言模型中计算单语言概率时,请参阅?

Nlp 什么是;字数“;在单语言模型中计算单语言概率时,请参阅?,nlp,Nlp,我使用的是一个单语言模型。我想计算每个单位格的概率。我应该将一个单字的出现次数除以不同单字的数量,还是除以所有单字的计数?除以训练集中单词出现的总数。原因很容易理解:如果你除以不同单词的数量,所有单词的概率不一定等于一,因此它们不会形成概率分布。Jurafsky的幻灯片是关于语言建模的一个很好的介绍: 我引用了奈良科学技术研究所的,但用start标记稍微修改了它的示例 这个例子不言自明 <s> i live in osaka . </s> <s> i am

我使用的是一个单语言模型。我想计算每个单位格的概率。我应该将一个单字的出现次数除以不同单字的数量,还是除以所有单字的计数?

除以训练集中单词出现的总数。原因很容易理解:如果你除以不同单词的数量,所有单词的概率不一定等于一,因此它们不会形成概率分布。

Jurafsky的幻灯片是关于语言建模的一个很好的介绍:

我引用了奈良科学技术研究所的,但用start标记稍微修改了它的示例

这个例子不言自明

<s> i live in osaka . </s> 
<s> i am a graduate student . </s>
<s> my school is in nara . </s>
p(我住在奈良)

(3/23)*(2/23)*(1/23)*(2/23)*(1/23)*(3/23)*(3/23) = (108)*(1/23)^7     

事实上,如果除以不同单词的数量,单个项目的概率甚至可以超过100%。。。。。。
(3/23)*(2/23)*(1/23)*(2/23)*(1/23)*(3/23)*(3/23) = (108)*(1/23)^7