Nlp 如何得到每种语言的一种逆引理化?

Nlp 如何得到每种语言的一种逆引理化?,nlp,stemming,lemmatization,Nlp,Stemming,Lemmatization,我发现了spacy lib,它允许我将柠檬化应用于单词blacks->black,EN bianchi->bianco,IT。我的工作是分析实体,而不是动词或形容词 我在寻找一种能让我拥有所有可能的单词的东西,从犬齿形式开始 比如从黑人到黑人,英语,或者意大利语的bianco,还有bianca、bianchi、bianche等等。有没有这样的库?我不清楚你到底在找什么,但是如果你只需要一个英语引理列表,你可以很容易地从我的GitHub库中提取出来。看一看。最初,它使用字典方法来进行引理化,这里有

我发现了spacy lib,它允许我将柠檬化应用于单词blacks->black,EN bianchi->bianco,IT。我的工作是分析实体,而不是动词或形容词

我在寻找一种能让我拥有所有可能的单词的东西,从犬齿形式开始


比如从黑人到黑人,英语,或者意大利语的bianco,还有bianca、bianchi、bianche等等。有没有这样的库?

我不清楚你到底在找什么,但是如果你只需要一个英语引理列表,你可以很容易地从我的GitHub库中提取出来。看一看。最初,它使用字典方法来进行引理化,这里有一个.csv文件,其中包含所有不同的引理及其变化。文件是LemmInflect/LemmInflect/resources/infl_lu.csv.gz。你必须从中提取引理。类似于

with gzip.open('LemmInflect/lemminflect/resources/infl_lu.csv.gz)` as f:
    for line in f.readlines():
        parts = lines.split(',')
        lemma = parts[0]
        pos = parts[1]
        print(lemma, pos)
或者,如果你需要一个系统来改变单词的词形,这就是Lemminflect的设计目的。您可以将其用作独立库或SpaCy的扩展。在README.md或文档中有关于如何使用它的示例


我应该注意的是,这是只为英语。我还没有看到太多关于单词屈折变化的代码,您可能很难在其他语言中找到这些代码。

这是否回答了您的问题?