自定义python levenshtein字符值

自定义python levenshtein字符值,python,levenshtein-distance,Python,Levenshtein Distance,我使用PythonLevenshtein模块在很长一段时间内分析爱尔兰语文本;随着时间的推移,文本的正字法会发生一些变化,例如bí->ḃí->bhí,在“b”上的变音符号和在“b”之后的“h”都代表了相同的Lention语法形式(在第一个句号中未显示) 在所有这些形式之间,我希望有一个相当低的距离,但使用python levenshtein距离,它给出了levenshtein.ratio(u'ḃ"b",u"b",u"b",u"b",u"b",u"b",u"b",u"b","b"b","b"的 那

我使用PythonLevenshtein模块在很长一段时间内分析爱尔兰语文本;随着时间的推移,文本的正字法会发生一些变化,例如bí->ḃí->bhí,在“b”上的变音符号和在“b”之后的“h”都代表了相同的Lention语法形式(在第一个句号中未显示)

在所有这些形式之间,我希望有一个相当低的距离,但使用python levenshtein距离,它给出了
levenshtein.ratio(u'ḃ"b",u"b",u"b",u"b",u"b",u"b",u"b",u"b","b"b","b"的


那么,有没有办法修改特定字符更改的值,例如缩短bíto的距离ḃ但是在bí和xí之间的距离?或者我需要生成自己的实现吗?

Levenshtein算法(“编辑距离”)不允许字符之间存在不同的距离,但有一种通用算法——Needleman-Wunsch算法——允许。我不知道Python实现,但建议您在实现自己的Python实现之前先寻找一个Python实现—这是可能的,但并非微不足道。

谢谢您的提示,我成功地实现了一种形式的Neederman Wunsch算法,以满足我的需要()