Python 我可以在WordNet中保存引理的原始共轭吗?

Python 我可以在WordNet中保存引理的原始共轭吗?,python,nlp,nltk,wordnet,lemmatization,Python,Nlp,Nltk,Wordnet,Lemmatization,我有一个使用NLTK和WordNet用同义词替换单词的脚本。据我所知,通过柠檬化找到同义词最有效的方法,但这会从过程中去除共轭 例如,假设我想用“钻孔”替换“钻孔” 输出: {'blase', 'bore', 'bored', 'drill', 'tire', 'world-weary'} 我可以使用一些词性过滤来确保我只返回动词,但它们不会被适当地修饰。我可以得到“钻孔”、“钻孔”和“轮胎”。。。我怎么会“无聊”、“无聊”和“累”?或者,如果我做名词,如果我想要“孔”、“钻”或“轮胎”怎么办

我有一个使用NLTK和WordNet用同义词替换单词的脚本。据我所知,通过柠檬化找到同义词最有效的方法,但这会从过程中去除共轭

例如,假设我想用“钻孔”替换“钻孔”

输出:

{'blase', 'bore', 'bored', 'drill', 'tire', 'world-weary'}
我可以使用一些词性过滤来确保我只返回动词,但它们不会被适当地修饰。我可以得到“钻孔”、“钻孔”和“轮胎”。。。我怎么会“无聊”、“无聊”和“累”?或者,如果我做名词,如果我想要“孔”、“钻”或“轮胎”怎么办


(我将手动检查这些,因此意义现在不是问题。)

这是表面实现的任务。在引理化并找到合适的同义词后,您可以使用SimpleLg或您选择的另一个曲面实现器来改变引理。您需要做的是检查原始单词的词形变化类型(例如,第三人称过去),并使用surface Realization module的功能恢复同义词。

我不确定NLTK是否有一种简单的方法可以做到这一点。你可以使用(我的项目)并让它根据原始单词的Penn Treebank标记对同义词进行屈折。谢谢,我只是使用[patterns[())提取时态,并使用pattern文档中的共轭参考表对其进行编码。到目前为止效果还不错。
{'blase', 'bore', 'bored', 'drill', 'tire', 'world-weary'}