将word替换为成本最低的水母python

将word替换为成本最低的水母python,python,regex,nltk,jaro-winkler,Python,Regex,Nltk,Jaro Winkler,我有一个完整的拼写正确的单词列表,名为ref.txt。我有一个句子列表,我用正则表达式从中提取单词。我将用一个例子来详细说明。 假设ref.txt包含-孟买、安德烈、雅各布圈、班德拉。 我有一个句子列表,比如- ['Blue Meadows near andhri ', 'Oberoi Heights opp windy road off Bnadra' , 'Red Heavens club ,behind Mumbia club near Jacob Circle'] 关于水母的文献

我有一个完整的拼写正确的单词列表,名为ref.txt。我有一个句子列表,我用正则表达式从中提取单词。我将用一个例子来详细说明。
假设ref.txt包含-
孟买、安德烈、雅各布圈、班德拉
。 我有一个句子列表,比如-

['Blue Meadows near andhri ', 'Oberoi Heights opp windy road off Bnadra' , 
'Red Heavens club ,behind Mumbia club near Jacob Circle']  
关于水母的文献不多

import jellyfish as jf  
jf.jaro_distance(andhri,andheri)
问题是,在使用正则表达式提取单词后,如何将其与整个列表进行比较。。由于成本最低,我的算法应自动为Andri建议“andheri”。

如果你还有其他想法要实施,请不要再提了。。谢谢

没错,据我所知,您希望您的程序建议最接近用户输入内容的单词。没有简单的方法可以做到这一点。你必须进行逐个角色的比较。将“andhri”中的每个字符与列表中每个单词的字符进行比较。还有一个柜台。最好是列出一个计数器列表,这样对您更合适。将列表中每个单词中的每个字母与“andhri”中的字母进行比较,每次找到匹配项时,增加相应的计数器。将列表中每个单词的每个字符与“andhri”进行比较后,检查计数器。应向用户建议与最高计数器对应的单词