Autocomplete 自动更正文档语料库

Autocomplete 自动更正文档语料库,autocomplete,machine-learning,nlp,nltk,text-analysis,Autocomplete,Machine Learning,Nlp,Nltk,Text Analysis,我有一个大约6GB大小的文档库,其中大部分是移动平台上用户生成的内容。由于该语料库的起源性质,它充斥着拼写错误、缩写和截断的单词。有没有一种方法可以将这些单词自动更正为最近的英语单词?这可能很有趣,因为您用机器学习标记了您的问题: 这是一本引人入胜的书。另一方面,如果你不想修补,一个更好的可能是附魔,看看

我有一个大约6GB大小的文档库,其中大部分是移动平台上用户生成的内容。由于该语料库的起源性质,它充斥着拼写错误、缩写和截断的单词。有没有一种方法可以将这些单词自动更正为最近的英语单词?

这可能很有趣,因为您用机器学习标记了您的问题:

这是一本引人入胜的书。另一方面,如果你不想修补,一个更好的可能是附魔,看看