Mysql Wordnet SQL解释

Mysql Wordnet SQL解释,mysql,database,semantics,wordnet,thesaurus,Mysql,Database,Semantics,Wordnet,Thesaurus,我正在尝试建立一个简单的同义词数据库并运行它,这样我就可以找到用户输入的单词的同义词(没有其他的!)。为此,我获取了Wordnet sql thesarus()的副本,但现在我看到了所有这些表,我在任何地方都找不到对其内容的任何简单解释: adjpositions adjpositiontypes casedwords lexdomains lexlinks linktypes morphmaps morphs postypes samples semlinks senses synsets v

我正在尝试建立一个简单的同义词数据库并运行它,这样我就可以找到用户输入的单词的同义词(没有其他的!)。为此,我获取了Wordnet sql thesarus()的副本,但现在我看到了所有这些表,我在任何地方都找不到对其内容的任何简单解释:

adjpositions
adjpositiontypes
casedwords
lexdomains
lexlinks
linktypes
morphmaps
morphs
postypes
samples
semlinks
senses
synsets
vframemaps
vframes
vframesentencemaps
vframesentences
words

有人能告诉我这些表格包含什么以及我需要什么,因为我无法根据它们的数据来解读它们的内容。

要正确理解Wordnet中各种术语的含义,您应该阅读。对于同义词,您主要需要
synsets
表。您下载的项目中的实际数据库表在项目的上有描述。

WordNet是一个超级酷的word数据库。我自己也在研究。我将在下面列出我的发现——希望它能帮助你更好地理解表格

Synset表 synsets表是数据库中最重要的表之一。它负责存储WordNet中的所有定义。synset表中的每一行都有一个synsetid、一个定义、一个pos(词类字段)和一个lexdomainid(链接到lexdomain表) WordNet数据库中有117373个语法集

单词表 WordNet还有一个“words”表,它只有两个字段:一个wordid和一个“lemma”。单词表负责容纳Wordnet数据库中的所有引理(基本单词)。 此表中有146625个条目

所以。。这两个表是如何链接的?答案是什么?感觉桌

感官表 sense表负责将单词(在单词表中)与定义(在synset表中)链接在一起。 词义表中的条目被称为“单词词义对”,因为单词ID和语法集的每一对都是单词的一个完整含义——“单词词义”。
WordNet数据库中总共有206354个词义

Lexdomains表 词义表引用Lexdomains表,用于定义词义对所属的词义域。lexdomains表中有45个词汇域。 因此,lexdomain表是WordNet“标记”词义对的方式。然而,它是相当有限的,因为一个词义对只能属于一个词汇域

45个词汇域包括:

形容词: 好的,佩特

副词 全部

名词 顶部、物品、动物、人工制品、属性、身体、认知、交流、事件、感觉、食物、群体、位置、动机、对象、人、现象、植物、占有、过程、数量、链接定义、形状、状态、物质、时间、

动词 身体、变化、认知、沟通、竞争、消费、接触、创造、情感、运动、感知、占有、社交、统计、天气、ppl

案例词汇表 单词表中的某些单词的首字母自然大写,即“A-team”。由于单词表将所有单词存储为小写,WordNet使用此表指定单词的大写版本。 此表中有40313个条目

WordNet数据库中还有许多其他表格,一旦我对它们进行了研究,我将再次发布

查找同义词 要回答有关同义词的问题,您需要执行以下操作

假设您想找到单词“Carry”的同义词。为了做到这一点,您将首先在单词表中搜索与单词“carry”匹配的引理。这将产生wordid 21253。然后搜索词义表,找到单词carry的所有词义对。这将产生41个结果-每个结果列出wordid 21253、senseid(这是单词sense对的索引)和synsetid

现在,您需要查询synset表中返回的每个synsetid,以便可以访问synset表中的关联定义字段

最后,要查找列出的每个语法集的同义词,只需在词义表中搜索共享同一语法集的其他词义对

例如: 下面列出了单词“进位”的41个词义对中的一个: 如果我们查找该synsetid 202083512的定义,您将发现“传输或用作传输介质”

要查找此定义的所有同义词,您需要在sense表中搜索相同的synsetid 202083512。这就产生了同义词:渠道、行为、传达、传递和传播 (注意:您需要左键连接单词表以获得实际的引理)


我希望这有助于为你揭开WordNet的神秘面纱。。我觉得这很酷…

保罗·普莱比希解释了几个核心表格,下面是对其余表格的简短解释:

形容词位置类型-定义了英语中形容词可以采取的三种位置:谓语、定语和直接后名词

adjpositions-将具体单词(形容词)与adjpositiontypes表中允许的位置类型链接起来

链接类型-定义wordnet中使用的所有关系(链接)类型,大约24种。lexlinks和semlinks表都使用此表定义每个链接的类型。某些链接类型标记为递归,这意味着如果“家具”是“椅子”的hypernim,则“椅子”是“家具”的下位词

词汇链接-词汇链接,即单词之间的关系。示例:
悲伤-悲伤(派生)

semlinks-语义链接,即语法集之间的关系。示例:
椅子-家具(缩写)

变形-连接到“单词”表,包含不规则的单词形式。一个单词可以有多个变体,一个变体