Nlp 英国柠檬草数据库?

Nlp 英国柠檬草数据库?,nlp,stemming,lemmatization,morphological-analysis,Nlp,Stemming,Lemmatization,Morphological Analysis,您是否知道有任何足够大的lemmatizer数据库可以为以下示例单词返回正确的结果: geese: goose plantes: //not found Wordnet的形态分析器不够,因为它给出了以下不正确的结果: geese: //not found plantes: plant 似乎在这方面做得更好,但它仍然发现“plantes”的结果不正确 也许你想使用MorphAdorner来进行柠檬化,然后对照WordNet检查结果。通过调用findtheinfo\u ds,您可以使用WordN

您是否知道有任何足够大的lemmatizer数据库可以为以下示例单词返回正确的结果:

geese: goose
plantes: //not found
Wordnet的形态分析器不够,因为它给出了以下不正确的结果:

geese: //not found
plantes: plant
似乎在这方面做得更好,但它仍然发现“plantes”的结果不正确

也许你想使用MorphAdorner来进行柠檬化,然后对照WordNet检查结果。通过调用
findtheinfo\u ds
,您可以使用WordNet API执行查找,而无需首先执行柠檬化。这允许您首先使用像Morphander这样的柠檬化器。(如果您想使用lemmaitzer,您需要单独调用
morph
,并对它返回的引理调用
findtheinfo\u ds
。)


另一方面,我只花了大约5秒钟的时间来研究Morphanderner,也许有一种方法可以消除不正确的“plantes”答案,而无需使用任何其他外部资源。

,有人向我建议,但我没有使用过它,所以我不知道它在这方面是否比WordNet更好。

谢谢,取消选中“标准化拼写”后,它返回
plante
,可以对照wordnet检查它是否正确(我直接使用wordnet文件)。但你知道“早期现代英语/十九世纪小说”选项是什么吗?它的语料库是否足够用于现代英语?@Johns:这就是我说我只花了大约5秒钟看的意思。试着浏览一下他们的文档,看看它是否有什么意义。它没有在线演示,但阅读描述时,它似乎不是基于数据库的。但是如果我没有时间的话,我会试试的。
plantes: plante
geese: goose