String 如何根据字符的相似程度定义两个字符串之间的距离?

String 如何根据字符的相似程度定义两个字符串之间的距离?,string,ocr,levenshtein-distance,String,Ocr,Levenshtein Distance,我使用OCR提取了一个文本,需要查找其中最类似于查询字符串的子字符串。我使用了描述的方法。和。 对于两个字符a和b,当使用定义为d(a,b)=int(a!=b)的距离时,我们有Levenshtein的距离。但在我的例子中,一些错误比其他错误更频繁,因为它们来自OCR。例如,i更可能被解读为1而不是c。 有没有什么方法可以用来根据两个字符的相似程度来定义它们之间的距离

我使用OCR提取了一个文本,需要查找其中最类似于查询字符串的子字符串。我使用了描述的方法。和。 对于两个字符
a
b
,当使用定义为
d(a,b)=int(a!=b)
的距离时,我们有Levenshtein的距离。但在我的例子中,一些错误比其他错误更频繁,因为它们来自OCR。例如,i更可能被解读为1而不是c。 有没有什么方法可以用来根据两个字符的相似程度来定义它们之间的距离