Nlp 理解OpenCalais的相关性得分

Nlp 理解OpenCalais的相关性得分,nlp,information-extraction,named-entity-recognition,opencalais,Nlp,Information Extraction,Named Entity Recognition,Opencalais,我试图了解opencalais返回的与每个实体相关的相关性分数是多少?它意味着什么?如何解释?我非常感谢您能深入了解这一点。他们的状态:相关性功能检测每个独特实体的重要性,并在0-1范围内分配相关性分数(1是最相关和最重要的) 虽然它们没有解释“相关性”的确切含义,但人们希望它能量化实体在文档论述中的中心地位。与随机文档(参见TF-IDF)中的预期频率相比,这可能受到诸如本文档中实体提及频率等因素的影响,但也可能涉及更复杂的话语分析。谢谢John。你认为这是一个概率分数吗?当他们用百分比表示时,

我试图了解opencalais返回的与每个实体相关的相关性分数是多少?它意味着什么?如何解释?我非常感谢您能深入了解这一点。

他们的状态:相关性功能检测每个独特实体的重要性,并在0-1范围内分配相关性分数(1是最相关和最重要的)


虽然它们没有解释“相关性”的确切含义,但人们希望它能量化实体在文档论述中的中心地位。与随机文档(参见TF-IDF)中的预期频率相比,这可能受到诸如本文档中实体提及频率等因素的影响,但也可能涉及更复杂的话语分析。

谢谢John。你认为这是一个概率分数吗?当他们用百分比表示时,我想知道这是否是一个概率分数,但我强烈感觉不是。你对此有何看法?我的应用程序将文本文档映射到其中的重要实体。您认为分数的范围会表明映射到文档足够重要吗?谢谢你的回复。嗨,忍者。我只能推测,但我猜这不是一个真实的概率。我最好的建议是做一些实验,看看你觉得什么好。我打赌你可以在10到15分钟的数据分析中找出一个合理的阈值。你将被迫决定哪一个更重要:遗漏重要的实体,还是包括有问题的实体。但这是相当主观的。