Machine learning 如何使用Mallet获取给定查询主题的概率
我想作为专家发现项目的一部分使用。我对Mallet几乎是新手,但我知道它从一组文档中训练主题。假设我有50个主题是由Mallet培训的。我想计算这个概率:Machine learning 如何使用Mallet获取给定查询主题的概率,machine-learning,information-retrieval,topic-modeling,mallet,topicmodels,Machine Learning,Information Retrieval,Topic Modeling,Mallet,Topicmodels,我想作为专家发现项目的一部分使用。我对Mallet几乎是新手,但我知道它从一组文档中训练主题。假设我有50个主题是由Mallet培训的。我想计算这个概率:p(主题q)或者p(主题q) q是查询。这是一个词(如算法、安卓等),我希望找到特定领域的专家 当我读到这篇文章时,其中一位用户说,我们可以使用--word topic counts file选项来计算概率。假设我通过Mallet生成了这个文件。其结构如下: 0 android 2:21 1 is 3:3 . . . 我知道这个结构的语义,但
p(主题q)
或者p(主题q)
q
是查询。这是一个词(如算法、安卓等),我希望找到特定领域的专家
当我读到这篇文章时,其中一位用户说,我们可以使用--word topic counts file
选项来计算概率。假设我通过Mallet生成了这个文件。其结构如下:
0 android 2:21
1 is 3:3
.
.
.
我知道这个结构的语义,但我不知道如何计算主题给定查询的概率(即p(topic | q)
或p(q | topic)
)
附言:我用“要么”这个词是因为我不确定mallet会计算出它们中的哪一个
任何帮助都将不胜感激请以 这里p(主题| q)可以计算为 p(19 |李约瑟)=2/3=0.67 及 p(17 |李约瑟)=1/3=0.33 以您自己的例子来说,它更简单:
0 android 2:21
p(2 | android)=1.0 这里p(主题| q)可以计算为 p(19 |李约瑟)=2/3=0.67 及 p(17 |李约瑟)=1/3=0.33 以您自己的例子来说,它更简单:
0 android 2:21
p(2 | android)=1.0谢谢,我真的被这个问题困住了谢谢,我真的被这个问题困住了