奇怪的柠檬化导致r,textstem包

奇怪的柠檬化导致r,textstem包,r,lemmatization,lexicon,R,Lemmatization,Lexicon,我想用R中的textstem包从所有可能的单词形式中得到引理“dive” 但是当我在r中使用textstem包时,基本形式变成了一个非常奇怪的结果 library(textstem) words<-c("dived", "diving", "dive") lemmatize_strings(words, dictionary = lexicon::hash_lemmas) [1] "dive" "dive" "diva" 我发现了这个链接(),但它在我的案例中可能没有用处,因为我需要

我想用R中的textstem包从所有可能的单词形式中得到引理“dive”

但是当我在r中使用textstem包时,基本形式变成了一个非常奇怪的结果

library(textstem)
words<-c("dived", "diving", "dive")

lemmatize_strings(words, dictionary = lexicon::hash_lemmas)

[1] "dive" "dive" "diva"
我发现了这个链接(),但它在我的案例中可能没有用处,因为我需要处理超过80000条评论,而且我很可能会遇到同一个问题,使用不同的词

我对我拥有的数据集使用了
lemmatize_strings
,但它给出了完全相同的结果(尽管有点明显)。有人能帮我吗


提前非常感谢

调整你的桌子
lemmas@lukeA,完美地解决了问题!非常感谢你!让我们把它改为“引理”,而不是“
引理”
;)
[1] "dive" "dive" "dive"