Nlp 英语动词及其时态、各种形式等的列表

Nlp 英语动词及其时态、各种形式等的列表,nlp,Nlp,是否有一个巨大的CSV/XML或任何包含英语动词及其变体列表的文件(例如sell->sell,sale,sell,sellee) 我想这对NLP系统会很有用,但似乎没有任何列表,或者这可能是我糟糕的谷歌搜索技能。有人有其他线索吗?我不知道你在找什么,但我认为WordNet——一个英语词汇数据库——将是一个很好的起点。阅读更多 我提到你的链接说 WordNet的结构使其成为计算语言学和自然语言处理的有用工具 考虑转储wiktionary并从中提取此信息。 提到这个词的许多形式(销售、销售、销售)

是否有一个巨大的CSV/XML或任何包含英语动词及其变体列表的文件(例如sell->sell,sale,sell,sellee)


我想这对NLP系统会很有用,但似乎没有任何列表,或者这可能是我糟糕的谷歌搜索技能。有人有其他线索吗?

我不知道你在找什么,但我认为
WordNet
——一个英语词汇数据库——将是一个很好的起点。阅读更多

我提到你的链接说

WordNet的结构使其成为计算语言学和自然语言处理的有用工具


考虑转储wiktionary并从中提取此信息。
提到这个词的许多形式(销售、销售、销售)

如果您的目标只是将单词规范化为一些基本规范形式,请考虑使用lemmatizer或词干分析器。试着玩一个真正好的英国柠檬虫游戏。

考虑一下:

类别变体数据库(Catvar)是一个未反映词(词素)及其类别(即词性)变体集群的数据库。例如,饥饿(V)、饥饿(N)、饥饿(AJ)和饥饿(N)是描述饥饿状态的一些基本概念的不同英语变体。另一个例子是开发集群:(developer(V)、developer(N)、developed(AJ)、developed(N)、developed(AJ)、developement(N))


CatVar似乎不再可用,链接已断开。你知道我还能在哪里找到它吗?你可以试着发一封电子邮件给论文的作者,要求得到正式版本。我在Github()中找到了一个非正式副本。