Algorithm 鲜为人知的字符串相似性度量

Algorithm 鲜为人知的字符串相似性度量,algorithm,language-agnostic,string,Algorithm,Language Agnostic,String,这可能是一个很难回答的问题,但我正在研究一些东西,我想知道是否有人知道“鲜为人知”的字符串相似性度量(参见著名度量的示例)。我去过维基百科,Sourceforge有一个很好的图书馆,叫做Wiki。有没有人做过一些研究,或者发现了一些字符串算法,这些算法没有太多的使用,引起了您的注意 谢谢。还有一类语音算法(例如)可能会添加到您的列表中。这(LingPipe)提供了一些关于字符串比较的提示。讨论了Damerau-Levenstein距离、Needlman-Wunsch算法、Jaccard距离、Ja

这可能是一个很难回答的问题,但我正在研究一些东西,我想知道是否有人知道“鲜为人知”的字符串相似性度量(参见著名度量的示例)。我去过维基百科,Sourceforge有一个很好的图书馆,叫做Wiki。有没有人做过一些研究,或者发现了一些字符串算法,这些算法没有太多的使用,引起了您的注意


谢谢。

还有一类语音算法(例如)可能会添加到您的列表中。

这(LingPipe)提供了一些关于字符串比较的提示。讨论了Damerau-Levenstein距离、Needlman-Wunsch算法、Jaccard距离、Jaro-Winkler距离、TF/IDF距离。距离被理解为两个字符串之间的相似性

在页面的末尾,它给出了参考,还提供了一个Java实现,可以随时使用()

签出 包括所有“请参阅”引用和所有用户评论。

(拼写相似性)是一种字符串相似性度量,旨在识别跨语言同源词(具有相同来源的单词)