Dictionary 支持同义词的txt或xml文件形式的英语词典

Dictionary 支持同义词的txt或xml文件形式的英语词典,dictionary,nlp,wordnet,Dictionary,Nlp,Wordnet,有人能告诉我哪里可以下载txt或xml格式的英语词典吗。我正在为自己构建一个简单的应用程序,并寻找一些我可以立即开始使用的东西,而无需学习复杂的API 对同义词的支持将非常好,也就是说,检索特定单词的所有同义词应该更容易 如果这本词典能列出英国和美国单词拼写的不同之处,那就太棒了 即使它是一本小字典(几千个单词),也没关系,我只需要一个小项目 如果价格合理,而且词典易于使用,我甚至愿意买一本——简单XML就好了 任何方向都可以。试试。就是你想要的。它很大,包含超过十万个条目,而且是免费提供的 但

有人能告诉我哪里可以下载txt或xml格式的英语词典吗。我正在为自己构建一个简单的应用程序,并寻找一些我可以立即开始使用的东西,而无需学习复杂的API

对同义词的支持将非常好,也就是说,检索特定单词的所有同义词应该更容易

如果这本词典能列出英国和美国单词拼写的不同之处,那就太棒了

即使它是一本小字典(几千个单词),也没关系,我只需要一个小项目

如果价格合理,而且词典易于使用,我甚至愿意买一本——简单XML就好了

任何方向都可以。

试试。

就是你想要的。它很大,包含超过十万个条目,而且是免费提供的

但是,它不是以XML形式存储的。要访问数据,您需要使用一种现有语言作为您选择的语言

使用API通常非常简单,所以我认为您不必太担心“学习(a)复杂API”。例如,借用基于Python的

虽然WordNet中有美国英语的偏见,但它支持英国的拼写和用法。例如,您可以查找“color”,而“lift”的一个语法集是“lifter.n.01”

XML注释

如果将数据表示为XML是必要的,那么您可以轻松地使用其中一个API访问WordNet数据库 并将其转换为XML,例如,请参见

我过去用过。它在纯文本文件中包含同义词信息。还有一些java代码可以帮助您解析文本

这些页面提供了一系列同义词表/词汇资源的链接,其中一些可以免费下载


我知道这个问题已经很老了,但我自己在查找txt文件时遇到了问题,因此如果有人想查找同义词和反义词txt文件数据库,请尝试最简单但非常详细的方法
.

但它包含的格式可能很难解析。它确实包括同义词和其他拼写。如果您喜欢原始xml,请在github上找到csv文件列表,Guy Lapalme(蒙特勒阿尔大学)我想补充一点,wordnet不包含形容词或副词的变位、复数或其他扩展。同样,老问题,新评论。使用notepad++将其修改为使用正则表达式所需的输出非常简单。谷歌你的问题添加记事本++到你的查询。
 >>> from nltk.corpus import wordnet
 >>> 
 >>> # Get All Synsets for 'dog'
 >>> # This is essentially all senses of the word in the db
 >>> wordnet.synsets('dog')
 [Synset('dog.n.01'), Synset('frump.n.01'), Synset('dog.n.03'), 
  Synset('cad.n.01'), Synset('frank.n.02'),Synset('pawl.n.01'), 
  Synset('andiron.n.01'), Synset('chase.v.01')]

 >>> # Get the definition and usage for the first synset
 >>> wn.synset('dog.n.01').definition
 'a member of the genus Canis (probably descended from the common 
 wolf) that has been domesticated by man since prehistoric times; 
 occurs in many breeds'
 >>> wn.synset('dog.n.01').examples
 ['the dog barked all night']

 >>> # Get antonyms for 'good'
 >>> wordnet.synset('good.a.01').lemmas[0].antonyms()
 [Lemma('bad.a.01.bad')]

 >>> # Get synonyms for the first noun sense of 'dog'
 >>> wordnet.synset('dog.n.01').lemmas
 [Lemma('dog.n.01.dog'), Lemma('dog.n.01.domestic_dog'), 
 Lemma('dog.n.01.Canis_familiaris')]

 >>> # Get synonyms for all senses of 'dog'
 >>> for synset in wordnet.synsets('dog'): print synset.lemmas
 [Lemma('dog.n.01.dog'), Lemma('dog.n.01.domestic_dog'), 
 Lemma('dog.n.01.Canis_familiaris')]
 ...
 [Lemma('frank.n.02.frank'), Lemma('frank.n.02.frankfurter'), 
 ...