Nlp 将拼写错误的单词转换为实际单词

Nlp 将拼写错误的单词转换为实际单词,nlp,nltk,stemming,lemmatization,Nlp,Nltk,Stemming,Lemmatization,我在做一个关于NLP的项目,我想在语料库中找到最突出的单词,当我计算所有单词的频率时,像“thi”,“realli”,“happi”,“babi”这样的单词出现在我的处理管道中,无论我是用词缀还是词干,结果都是一样的,有人能告诉我如何将这些转化为实际的单词或关于柠檬化或词干化的东西吗。你能分享你的代码的相关部分吗?@Bitswazky thx但我发现它实际上是python NLTK的词干化引擎,无论出于什么原因转换为really->realli,happy->happi

我在做一个关于NLP的项目,我想在语料库中找到最突出的单词,当我计算所有单词的频率时,像
“thi”,“realli”,“happi”,“babi”
这样的单词出现在我的处理管道中,无论我是用词缀还是词干,结果都是一样的,有人能告诉我如何将这些转化为实际的单词或关于柠檬化或词干化的东西吗。

你能分享你的代码的相关部分吗?@Bitswazky thx但我发现它实际上是python NLTK的词干化引擎,无论出于什么原因转换为really->realli,happy->happi