Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/video/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Nlp 潜在语义分析如何处理语义_Nlp_Latent Semantic Analysis - Fatal编程技术网

Nlp 潜在语义分析如何处理语义

Nlp 潜在语义分析如何处理语义,nlp,latent-semantic-analysis,Nlp,Latent Semantic Analysis,我已经通过了LSA方法。据说LSA可以用于语义分析。但我不明白它是如何在LSA工作的。谁能告诉我LSA是如何处理语义的。你熟悉向量空间模型(VSM)吗 在LSA中,您可以像使用传统VSM一样计算文档相似性以及类型(即单词)相似性。也就是说,计算两个类型向量或两个文档向量之间的余弦(实际上LSA也允许计算类型文档相似性) VSM的问题是,不共享单个单词的文档的余弦相似性等于0 在LSA中,奇异值分解(SVD)揭示了潜在的语义维度,允许 您需要计算文档之间的余弦相似度,这些文档没有共同的词,但有一些

我已经通过了LSA方法。据说LSA可以用于语义分析。但我不明白它是如何在LSA工作的。谁能告诉我LSA是如何处理语义的。

你熟悉向量空间模型(VSM)吗

在LSA中,您可以像使用传统VSM一样计算文档相似性以及类型(即单词)相似性。也就是说,计算两个类型向量或两个文档向量之间的余弦(实际上LSA也允许计算类型文档相似性)

VSM的问题是,不共享单个单词的文档的余弦相似性等于0

在LSA中,奇异值分解(SVD)揭示了潜在的语义维度,允许
您需要计算文档之间的余弦相似度,这些文档没有共同的词,但有一些共同的特征。

谢谢:)我非常感谢您的回答。我什么都懂。目前尚不清楚的是LSA如何识别文档之间的共同特征,因为它只是数学模型的另一个例子。如何解释LSA中的结果仍然是一个悬而未决的问题!让我向你推荐《潜在语义分析手册》(或者你可能已经读过了?),这本手册很好地概述了LSA。当然:)这是TOC:你可以在互联网上找到一些论文。。。像这个: