Nlp 词的层次语义距离

Nlp 词的层次语义距离,nlp,dataset,semantics,hierarchical-data,Nlp,Dataset,Semantics,Hierarchical Data,我需要一个有标签的数据(人类判断)来表示多对单词(至少数百对)之间的结构/层次语义距离 例如,d(计算机、电视)

我需要一个有标签的数据(人类判断)来表示多对单词(至少数百对)之间的结构/层次语义距离

例如,d(计算机、电视) 如果我们将所有单词组织在一个dendogram或一棵树中,其中每个节点都是一个类别(“电子设备”、“带屏幕”等),并且单词是叶子,那么这个数字将表示我们从一个单词到另一个单词的步数(节点)

是否存在这样的数据集? 每对夫妇的评级就足够了,不需要完全嵌入/树/指定节点 (示例数据集为:

电脑电视1

广播电视2

洗碗机电视3


谢谢!

我现在知道了这样的人类判断数据集,但我想你可以看看像WordNet这是一个英语词汇数据库,以图形的形式。给定两个单词,你可以计算WordNet中代表它们的节点之间的距离

名词和动词都被组织成层次结构,由 超级名词或是一种关系。例如,单词的一种意义 dog是按照超词层次结构找到的;单词处于同一级别 表示语法集成员。每组同义词都有一个唯一的索引

dog, domestic dog, Canis familiaris
 canine, canid
  carnivore
   placental, placental mammal, eutherian, eutherian mammal
    mammal
     vertebrate, craniate
      chordate
       animal, animate being, beast, brute, creature, fauna
        ...

如果您正在查找数据集,也可以询问。

谢谢您提供的数据集参考,我不知道。我会在那里询问。我熟悉WordNet,但它不够好,因为它是手工定义的,并且有一些不太精确的定义。我想将WordNet与word2vec距离一起使用,但为此,我希望有人类的判断数据a作为标签。