Machine learning 二阶逐点互信息中的B1和B2是什么意思?

Machine learning 二阶逐点互信息中的B1和B2是什么意思?,machine-learning,statistics,nlp,Machine Learning,Statistics,Nlp,我需要知道我怎样才能得到和 伽玛在这里指的是什么 我认为您使用的指标来自本文(尽管他们给出的形式与您的不完全相同): 伊斯兰教,A.和Inkpen,D.2006。“二阶共现PMI 确定词语的语义相似性”。在 国际语言资源与评价会议(LREC) 意大利热那亚,第1033-1038页 可以在网上找到 它们给出了设置beta的以下规则: 其中delta是一个常数,其值取决于语料库的大小。Islam&Inkpen使用6.5,但您可能应该查看原始文件以了解所涉及的权衡。您是否要求PMI的相似性度量?如

我需要知道我怎样才能得到和

伽玛在这里指的是什么


我认为您使用的指标来自本文(尽管他们给出的形式与您的不完全相同):

伊斯兰教,A.和Inkpen,D.2006。“二阶共现PMI 确定词语的语义相似性”。在 国际语言资源与评价会议(LREC) 意大利热那亚,第1033-1038页

可以在网上找到

它们给出了设置beta的以下规则:


其中delta是一个常数,其值取决于语料库的大小。Islam&Inkpen使用6.5,但您可能应该查看原始文件以了解所涉及的权衡。

您是否要求PMI的相似性度量?如果你问的是相似性,你从哪个相似性度量中得到这个公式?我问的是SCO-PMI,我想知道这个符号指的是什么?Beta1,Beta2谢谢你的帮助,我之前读过这篇文章,我能给delta一些号码吗?规则中的n是指什么?n是语料库中单词类型的数量。阅读这篇文章可能会有所帮助,但我从中感觉到,作者几乎是通过反复试验来设置delta的,所以你可能只想尝试一些不同的值,看看你得到了什么样的结果。非常感谢你的帮助,但我搜索了beta指的是什么。。!?我没有找到。我在帖子中编辑了新规则,也不知道Gama指的是什么?非常感谢你的帮助