Python 给定一个词,我们能用Spacy得到所有可能的引理吗?
输入词是独立的,不是句子的一部分,但我想得到它所有可能的引理,就好像输入词在不同的句子中,有所有可能的词性标记一样。我还想得到单词引理的查找版本 我为什么要这样做 我从所有文档中提取了引理,还计算了引理之间的依赖链接数量。我使用Python 给定一个词,我们能用Spacy得到所有可能的引理吗?,python,nlp,spacy,lemmatization,spacy-3,Python,Nlp,Spacy,Lemmatization,Spacy 3,输入词是独立的,不是句子的一部分,但我想得到它所有可能的引理,就好像输入词在不同的句子中,有所有可能的词性标记一样。我还想得到单词引理的查找版本 我为什么要这样做 我从所有文档中提取了引理,还计算了引理之间的依赖链接数量。我使用en\u core\u web\u sm完成了这两项工作。现在,给定一个输入词,我想返回与输入词的所有可能引理联系最频繁的引理 因此,简而言之,我想复制标记的行为。_引理为输入单词添加所有可能的词性标记,以保持与我计算的引理链接的一致性。我发现,如果不先构造一个示例句子来
en\u core\u web\u sm
完成了这两项工作。现在,给定一个输入词,我想返回与输入词的所有可能引理联系最频繁的引理
因此,简而言之,我想复制
标记的行为。_引理
为输入单词添加所有可能的词性标记,以保持与我计算的引理链接的一致性。我发现,如果不先构造一个示例句子来给出上下文,很难直接从空格中获取引理和屈折。这并不理想,所以我进一步研究发现它做得非常好
> from lemminflect import getInflection, getAllInflections, getAllInflectionsOOV
> getAllLemmas('watches')
{'NOUN': ('watch',), 'VERB': ('watch',)}
> getAllInflections('watch')
{'NN': ('watch',), 'NNS': ('watches', 'watch'), 'VB': ('watch',), 'VBD': ('watched',), 'VBG': ('watching',), 'VBZ': ('watches',), 'VBP': ('watch',)}
谢谢,我将使用它作为spaCy的扩展来计算我的引理依赖链接。这样我觉得我会保持一致性。