编写一个Python方法,根据字符串生成打字错误
我可以添加一些东西,根据Levenshtein距离2,或者类似的东西,或者反向工程来创建打字错误 然而,最常见的打字错误是什么编写一个Python方法,根据字符串生成打字错误,python,levenshtein-distance,Python,Levenshtein Distance,我可以添加一些东西,根据Levenshtein距离2,或者类似的东西,或者反向工程来创建打字错误 然而,最常见的打字错误是什么 有人写过方法吗?没有一般的打字生成算法,因为这种算法取决于目标语言和应用程序-即要生成垃圾邮件域,您基本上需要应用以下策略(以meta.stackoverflow.com为例): 缺少的点:met*as*tackoverflow.com(应该很简单;) 字符插入:meta.stackoverfo*ww*.com(只需为每个字符添加一个副本) 字符省略:meta.stac
有人写过方法吗?没有一般的打字生成算法,因为这种算法取决于目标语言和应用程序-即要生成垃圾邮件域,您基本上需要应用以下策略(以meta.stackoverflow.com为例):
希望这能有所帮助。我觉得单靠Levenshtein距离是不够的,因为它没有考虑键盘,例如kitten和kitten的距离应该比Kittn和kitten(在qwerty键盘上)的距离大得多。哦,顺便说一句,你的用户名有两个输入错误。你知道,这是“请”。有趣的是,我问了一个问题,考虑到你的第二个“字符替换场景(键盘接近度)”,是否存在某种Levenshtein距离。你可能知道吗?@PascalvKooten可能是这样的: