Nlp 如何在文档中查找相关术语

Nlp 如何在文档中查找相关术语,nlp,information-retrieval,hierarchical-clustering,information-extraction,Nlp,Information Retrieval,Hierarchical Clustering,Information Extraction,要将相关术语群集到我的查询术语。术语应相互关联,而不是具有相似的含义。以“印度”为例,我想把“宝莱坞”、“泰姬陵”、“卡里”、“尼泊尔”和“中国”等与“印度”相关的术语进行分类 我使用术语的频率来聚类相关术语,也就是说,一个术语在同一文档中出现的次数越多,与我的查询术语(印度)相关的可能性就越大。但问题是,它还与文档中的动词、页码、参考关键字等相关 我的问题是: 1) 如何使该技术可靠并避免不相关的术语 2) 除此之外,最简单但最可靠的技术是什么?我认为此链接将对您有所帮助。在我看来,主题模型(

要将相关术语群集到我的查询术语。术语应相互关联,而不是具有相似的含义。以“印度”为例,我想把“宝莱坞”、“泰姬陵”、“卡里”、“尼泊尔”和“中国”等与“印度”相关的术语进行分类

我使用术语的频率来聚类相关术语,也就是说,一个术语在同一文档中出现的次数越多,与我的查询术语(印度)相关的可能性就越大。但问题是,它还与文档中的动词、页码、参考关键字等相关

我的问题是:

1) 如何使该技术可靠并避免不相关的术语


2) 除此之外,最简单但最可靠的技术是什么?

我认为此链接将对您有所帮助。在我看来,主题模型(LDA)是一个很好的选择。我认为这个链接会对你有所帮助。在我看来,主题模型(LDA)是一个不错的选择