Algorithm 确定数字键入错误的概率

Algorithm 确定数字键入错误的概率,algorithm,language-agnostic,numeric,Algorithm,Language Agnostic,Numeric,我有: 正确的数字ID,如电话号码/社保号码/等 另一个数字,来自某个数据输入表单 第二个数字类似,但不等于第一个数字。 两个数字都有效 我想计算第二个数字实际上是第一个数字的输入错误的可能性 此类错误可能包括: 差了几位数 转置数字 误读数字(1-7、4-9、3-8、2-5) 有人知道这种算法/代码的存在吗 编辑: 我不是在寻找一个通用的字符串相似性算法。我正在寻找一种针对人名输入错误进行优化的算法,或者是关于这个主题的一些研究。有几种 您可以实现某种不同的或Damerau-Levensh

我有:

  • 正确的数字ID,如电话号码/社保号码/等
  • 另一个数字,来自某个数据输入表单
  • 第二个数字类似,但不等于第一个数字。 两个数字都有效

    我想计算第二个数字实际上是第一个数字的输入错误的可能性

    此类错误可能包括:

    • 差了几位数
    • 转置数字
    • 误读数字(1-7、4-9、3-8、2-5)
    有人知道这种算法/代码的存在吗

    编辑:

    我不是在寻找一个通用的字符串相似性算法。我正在寻找一种针对人名输入错误进行优化的算法,或者是关于这个主题的一些研究。

    有几种


    您可以实现某种不同的或Damerau-Levenshtein距离,以对错误类型进行不同的评级。

    将数字视为一个数字序列,并计算两个数字之间的相似性比率。
    
    2.0*M/T。
    
    其中T是两个数字中的位数 M是两个数字中的匹配数

    相似比为0.6及以上意味着这两个数字相似

    请注意,如果数字相同,则比率为1,如果相同,则比率为0 它们没有共同的数字