Algorithm 鲜为人知的字符串相似性度量_Algorithm_Language Agnostic_String

Algorithm 鲜为人知的字符串相似性度量

algorithm language-agnostic string

Algorithm 鲜为人知的字符串相似性度量,algorithm,language-agnostic,string,Algorithm,Language Agnostic,String,这可能是一个很难回答的问题，但我正在研究一些东西，我想知道是否有人知道“鲜为人知”的字符串相似性度量（参见著名度量的示例）。我去过维基百科，Sourceforge有一个很好的图书馆，叫做Wiki。有没有人做过一些研究，或者发现了一些字符串算法，这些算法没有太多的使用，引起了您的注意谢谢。还有一类语音算法（例如）可能会添加到您的列表中。这（LingPipe）提供了一些关于字符串比较的提示。讨论了Damerau-Levenstein距离、Needlman-Wunsch算法、Jaccard距离、Ja

这可能是一个很难回答的问题，但我正在研究一些东西，我想知道是否有人知道“鲜为人知”的字符串相似性度量（参见著名度量的示例）。我去过维基百科，Sourceforge有一个很好的图书馆，叫做Wiki。有没有人做过一些研究，或者发现了一些字符串算法，这些算法没有太多的使用，引起了您的注意

谢谢。

还有一类语音算法（例如）可能会添加到您的列表中。

这（LingPipe）提供了一些关于字符串比较的提示。讨论了Damerau-Levenstein距离、Needlman-Wunsch算法、Jaccard距离、Jaro-Winkler距离、TF/IDF距离。距离被理解为两个字符串之间的相似性

在页面的末尾，它给出了参考，还提供了一个Java实现，可以随时使用（）

签出包括所有“请参阅”引用和所有用户评论。

（拼写相似性）是一种字符串相似性度量，旨在识别跨语言同源词（具有相同来源的单词）