Algorithm “什么是”呢;“最不常见的归属者”;如何计算呢?

Algorithm “什么是”呢;“最不常见的归属者”;如何计算呢?,algorithm,wordnet,Algorithm,Wordnet,我想用Wu和Palmer方法计算wordnet中的相似性度量 wp = (2 X depth(lcs)) / (depth(synset1) + depth(synset2)) 其中,lcs是synset1和synset2 我的问题是: 什么是“最不常见的归属” 如何计算 据此,两个概念A和B的最不常见的归属是“最具体的概念,它是A和B的祖先”,其中概念树由is-A关系定义。一个概念被定义为另一个概念的祖先,就像你在人类家谱中定义祖先一样,祖先是另一个概念的父代,祖父母,等等。例如: 汽车就是

我想用Wu和Palmer方法计算wordnet中的相似性度量

wp = (2 X depth(lcs)) / (depth(synset1) + depth(synset2))
其中,
lcs
synset1
synset2

我的问题是:

  • 什么是“最不常见的归属”
  • 如何计算
  • 据此,两个概念A和B的最不常见的归属是“最具体的概念,它是A和B的祖先”,其中概念树由
    is-A
    关系定义。一个概念被定义为另一个概念的祖先,就像你在人类家谱中定义祖先一样,祖先是另一个概念的父代,祖父母,等等。例如:

  • 汽车就是汽车,汽车就是交通工具
  • 船是一种交通工具
  • 车辆是一个物体
  • 图中:

    Object | Vehicle | --------- | | Boat Automobile | Car 对象 | 车辆 | --------- | | 船用汽车 | 汽车 在这种情况下,“汽车”是“汽车”的父代(也是祖先),而“汽车”是“汽车”的祖先。“车”也是“船”的祖先。在这种情况下,“船”和“车”的LCS是“车”,因为它是最具体的概念,是“船”和“车”的祖先。请注意,虽然“object”是“boat”和“car”的共同子类,但这并不是最不重要的,因为还有一个“object”(在本例中是“vehicle”)的子类,它也是“car”和“boat”的共同子类。“汽车”不是最不常见的归属词,因为它不是“船”的祖先

    为了计算相似性度量,我建议您使用可用的库,否则您需要自己构建概念图,这很麻烦

    在Perl中,可以使用

    在Python中,可以使用nltk包,特别是


    在Java中,您可以使用

    您尝试过什么?你认为完成这项任务需要什么样的文件?我想知道,什么是“最不常见的包容体”?所以你的问题是:“什么是最不常见的包容体?”。在这种情况下,你应该清楚地说明这一点,然后只问如何计算。我建议你使用。它是一个java库,基于知识表示分析实现了许多语义度量,特别是可以用来比较分类法中结构化概念的度量(例如,Wu和Palmer提出的度量)。WordNet并不总是一棵树。如果对中的每个节点都有多个祖先,那么如何计算lcs呢?感谢您的回答,现在我想知道lcs(船、车)的深度是多少?是3号还是4号?我建议你多读一些关于Tree()的内容。基本上,深度是从树根开始计算的。使用我的图形,根是
    对象
    。因此,
    对象
    的深度为0。现在,
    LCS(船、车)
    Vehicle
    ,所以深度是1。它应该是“最具体的概念”,所以它是最下面的,这仍然是
    Vehicle
    @非常感谢你的回答,但我意识到我的问题很愚蠢:D很明显,它必须是最具体的概念,否则你总是会得到LCS为1[因为所有东西都是由夸克(或原子或基本单位或任何东西)组成]:P