Nlp 从语料库中提取相似的单词

Nlp 从语料库中提取相似的单词,nlp,string-matching,similarity,text-extraction,approximate,Nlp,String Matching,Similarity,Text Extraction,Approximate,我想从语料库中提取类似的单词。相似性基于字符串。即,当两个单词的字符串高度相似时,两个单词提取为相似单词。例如,如果语料库包含:Aras、bahro、arasis、adkpo、bah、Aras sd、kio 类似的词语: 1-阿拉斯,阿拉斯,阿拉斯sd 2-呸,呸 如何解决这个问题? 谢谢。是一个度量两个单词序列之间差异的指标,也许你可以取一个单词序列并计算距离,以知道它们是否相似。我想添加这样一个参考:你可以检查我对类似问题的回答:

我想从语料库中提取类似的单词。相似性基于字符串。即,当两个单词的字符串高度相似时,两个单词提取为相似单词。例如,如果语料库包含:Aras、bahro、arasis、adkpo、bah、Aras sd、kio

类似的词语:

1-阿拉斯,阿拉斯,阿拉斯sd

2-呸,呸

如何解决这个问题?
谢谢。

是一个度量两个单词序列之间差异的指标,也许你可以取一个单词序列并计算距离,以知道它们是否相似。

我想添加这样一个参考:你可以检查我对类似问题的回答: