Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/amazon-web-services/13.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Nlp 如何在GSDMM中获得属于某个主题的文本的概率?_Nlp_Topic Modeling - Fatal编程技术网

Nlp 如何在GSDMM中获得属于某个主题的文本的概率?

Nlp 如何在GSDMM中获得属于某个主题的文本的概率?,nlp,topic-modeling,Nlp,Topic Modeling,在LDA中,有一种方法可以提取文本属于某个主题的概率。GSM中有类似的东西吗?如果是,包和代码是什么 谢谢根据,您可以使用以下公式获得此概率: 它可以按如下方式使用: >> mgp.score(["my", "beautiful", "text", "is", "here"]) [(0, 5.408052732645677e-10), (1, 2.2084257143830565e-0

在LDA中,有一种方法可以提取文本属于某个主题的概率。GSM中有类似的东西吗?如果是,包和代码是什么

谢谢

根据,您可以使用以下公式获得此概率:

它可以按如下方式使用:

>> mgp.score(["my", "beautiful", "text", "is", "here"])
[(0, 5.408052732645677e-10),
(1, 2.2084257143830565e-05),
(2, 0.022683564559983955),
(3, 0.0009818820143112778),
(4, 0.5482598416951635),          
(5, 0.1022196373411148),
(6, 0.049452600413189024),
(7, 1.710484812050781e-06),
(8, 0.004729435817210187),
(9, 8.314540183290251e-06),
(10, 0.13690067779136778),
(11, 0.00018238304274319198),
(12, 5.3021228234619835e-05),
(13, 0.010612516369262397),
(14, 7.432649699440398e-05),
(15, 0.004651235422841561),
(16, 0.001587346363887785),
(17, 0.005119983861692937),
(18, 6.710854911425749e-05),
(19, 0.11239232920994387)]
它返回成对的
(主题id,概率)

请注意,
score
函数接受令牌列表,而不是字符串本身。如果你通过

mgp.score("my beautiful text is here")
它将被视为

mgp.score(['m', 'y', ' ', 'b', 'e', 'a', 'u', 't', 'i', 'f', 'u', 'l', ' ', 't', 'e', 'x', 't', ' ', 'i', 's', ' ', 'h', 'e', 'r', 'e'])
根据,您可以使用以下公式获得此概率:

它可以按如下方式使用:

>> mgp.score(["my", "beautiful", "text", "is", "here"])
[(0, 5.408052732645677e-10),
(1, 2.2084257143830565e-05),
(2, 0.022683564559983955),
(3, 0.0009818820143112778),
(4, 0.5482598416951635),          
(5, 0.1022196373411148),
(6, 0.049452600413189024),
(7, 1.710484812050781e-06),
(8, 0.004729435817210187),
(9, 8.314540183290251e-06),
(10, 0.13690067779136778),
(11, 0.00018238304274319198),
(12, 5.3021228234619835e-05),
(13, 0.010612516369262397),
(14, 7.432649699440398e-05),
(15, 0.004651235422841561),
(16, 0.001587346363887785),
(17, 0.005119983861692937),
(18, 6.710854911425749e-05),
(19, 0.11239232920994387)]
它返回成对的
(主题id,概率)

请注意,
score
函数接受令牌列表,而不是字符串本身。如果你通过

mgp.score("my beautiful text is here")
它将被视为

mgp.score(['m', 'y', ' ', 'b', 'e', 'a', 'u', 't', 'i', 'f', 'u', 'l', ' ', 't', 'e', 'x', 't', ' ', 'i', 's', ' ', 'h', 'e', 'r', 'e'])

你是说GSDMM还是GSM?您的问题的标题或正文似乎都有输入错误。您是指GSDMM还是GSM?你的问题的标题或正文似乎都有拼写错误。