Algorithm “什么是”呢；“最不常见的归属者”；如何计算呢？_Algorithm_Wordnet

Algorithm “什么是”呢；“最不常见的归属者”；如何计算呢？

algorithm

Algorithm “什么是”呢；“最不常见的归属者”；如何计算呢？,algorithm,wordnet,Algorithm,Wordnet,我想用Wu和Palmer方法计算wordnet中的相似性度量 wp = (2 X depth(lcs)) / (depth(synset1) + depth(synset2)) 其中，lcs是synset1和synset2 我的问题是: 什么是“最不常见的归属” 如何计算据此，两个概念A和B的最不常见的归属是“最具体的概念，它是A和B的祖先”，其中概念树由is-A关系定义。一个概念被定义为另一个概念的祖先，就像你在人类家谱中定义祖先一样，祖先是另一个概念的父代，祖父母，等等。例如：汽车就是

我想用Wu和Palmer方法计算wordnet中的相似性度量

wp = (2 X depth(lcs)) / (depth(synset1) + depth(synset2))

其中，

lcs

是

synset1

和

synset2

我的问题是:

什么是“最不常见的归属”

如何计算

据此，两个概念A和B的最不常见的归属是“最具体的概念，它是A和B的祖先”，其中概念树由

is-A

关系定义。一个概念被定义为另一个概念的祖先，就像你在人类家谱中定义祖先一样，祖先是另一个概念的父代，祖父母，等等。例如：

汽车就是汽车，汽车就是交通工具

船是一种交通工具

车辆是一个物体

图中：

Object | Vehicle | --------- | | Boat Automobile | Car 对象 | 车辆 | --------- | | 船用汽车 | 汽车在这种情况下，“汽车”是“汽车”的父代（也是祖先），而“汽车”是“汽车”的祖先。“车”也是“船”的祖先。在这种情况下，“船”和“车”的LCS是“车”，因为它是最具体的概念，是“船”和“车”的祖先。请注意，虽然“object”是“boat”和“car”的共同子类，但这并不是最不重要的，因为还有一个“object”（在本例中是“vehicle”）的子类，它也是“car”和“boat”的共同子类。“汽车”不是最不常见的归属词，因为它不是“船”的祖先

为了计算相似性度量，我建议您使用可用的库，否则您需要自己构建概念图，这很麻烦

在Perl中，可以使用

在Python中，可以使用nltk包，特别是

在Java中，您可以使用

您尝试过什么？你认为完成这项任务需要什么样的文件？我想知道，什么是“最不常见的包容体”？所以你的问题是：“什么是最不常见的包容体？”。在这种情况下，你应该清楚地说明这一点，然后只问如何计算。我建议你使用。它是一个java库，基于知识表示分析实现了许多语义度量，特别是可以用来比较分类法中结构化概念的度量（例如，Wu和Palmer提出的度量）。WordNet并不总是一棵树。如果对中的每个节点都有多个祖先，那么如何计算lcs呢？感谢您的回答，现在我想知道lcs（船、车）的深度是多少？是3号还是4号？我建议你多读一些关于Tree（）的内容。基本上，深度是从树根开始计算的。使用我的图形，根是

对象

。因此，

对象

的深度为0。现在，

LCS（船、车）

是

Vehicle

，所以深度是1。它应该是“最具体的概念”，所以它是最下面的，这仍然是

Vehicle

@非常感谢你的回答，但我意识到我的问题很愚蠢：D很明显，它必须是最具体的概念，否则你总是会得到LCS为1[因为所有东西都是由夸克（或原子或基本单位或任何东西）组成]：P