Nlp 多语言命名实体链接

Nlp 多语言命名实体链接,nlp,cluster-analysis,named-entity-recognition,Nlp,Cluster Analysis,Named Entity Recognition,我正在研究一种聚类算法,将来自不同来源的新闻文章聚类成一个事件,类似于谷歌新闻。除了一个问题外,一切都很顺利 我对阿拉伯语新闻文章进行聚类,算法运行得非常好,在政治和体育文章中显示出非常好的结果,但在游戏和技术方面,结果并不那么好。问题是我的召回率很低(集群比应该的要少) 经过调查,我发现问题在于命名实体。在《游戏与科技》中,作者似乎在使用英文名称或阿拉伯语等效名称之间混用,这对影响最大的标题术语产生了影响,这通常会影响最终结果 现在,我正在寻找一种方法来找到相同的命名实体,即使它们使用不同的语

我正在研究一种聚类算法,将来自不同来源的新闻文章聚类成一个事件,类似于谷歌新闻。除了一个问题外,一切都很顺利

我对阿拉伯语新闻文章进行聚类,算法运行得非常好,在政治和体育文章中显示出非常好的结果,但在游戏和技术方面,结果并不那么好。问题是我的召回率很低(集群比应该的要少)

经过调查,我发现问题在于命名实体。在《游戏与科技》中,作者似乎在使用英文名称或阿拉伯语等效名称之间混用,这对影响最大的标题术语产生了影响,这通常会影响最终结果

现在,我正在寻找一种方法来找到相同的命名实体,即使它们使用不同的语言。我仍然不知道具体是怎么回事,我非常感谢您的帮助。

您可以看看“维基解密”:

这些工具通常或多或少地依赖于dbpedia,它提供了语言之间的链接。另一个解决方案是下载dbpedia的语言版本,并提取不同语言的名称变体:更多的工作,但可能更快、更相关