Algorithm 确定数字键入错误的概率
我有:Algorithm 确定数字键入错误的概率,algorithm,language-agnostic,numeric,Algorithm,Language Agnostic,Numeric,我有: 正确的数字ID,如电话号码/社保号码/等 另一个数字,来自某个数据输入表单 第二个数字类似,但不等于第一个数字。 两个数字都有效 我想计算第二个数字实际上是第一个数字的输入错误的可能性 此类错误可能包括: 差了几位数 转置数字 误读数字(1-7、4-9、3-8、2-5) 有人知道这种算法/代码的存在吗 编辑: 我不是在寻找一个通用的字符串相似性算法。我正在寻找一种针对人名输入错误进行优化的算法,或者是关于这个主题的一些研究。有几种 您可以实现某种不同的或Damerau-Levensh
- 差了几位数
- 转置数字
- 误读数字(1-7、4-9、3-8、2-5)
您可以实现某种不同的或Damerau-Levenshtein距离,以对错误类型进行不同的评级。将数字视为一个数字序列,并计算两个数字之间的相似性比率。
2.0*M/T。
其中T是两个数字中的位数
M是两个数字中的匹配数
相似比为0.6及以上意味着这两个数字相似
请注意,如果数字相同,则比率为1,如果相同,则比率为0
它们没有共同的数字