Java 是否有一个有效的实现来量化两个字符串之间的相似性?

Java 是否有一个有效的实现来量化两个字符串之间的相似性?,java,string,levenshtein-distance,Java,String,Levenshtein Distance,假设我有几个非常长的字符串,由完全随机的字符组成。我的目的是表示它们与数字中指定的主字符串的相似性 例如:12345与23456非常相似,但与12abcdef不太相似 假设是Java,这种算法是否已经有了有效的实现? 例如,我认为这可能会满足我的要求: 但是对于超长字符串,我需要一些非常有效的方法。我不确定是否有java实现,但是您可以在这里找到算法的实现: 祝你好运:)我不确定是否有它的java实现,但你可以在这里找到算法的实现: 祝你好运:)不幸的是,“高效”并不精确。在什么方面有效?时

假设我有几个非常长的字符串,由完全随机的字符组成。我的目的是表示它们与数字中指定的主字符串的相似性

例如:12345与23456非常相似,但与12abcdef不太相似

假设是Java,这种算法是否已经有了有效的实现? 例如,我认为这可能会满足我的要求:
但是对于超长字符串,我需要一些非常有效的方法。

我不确定是否有java实现,但是您可以在这里找到算法的实现:


祝你好运:)

我不确定是否有它的java实现,但你可以在这里找到算法的实现:

祝你好运:)

不幸的是,“高效”并不精确。在什么方面有效?时间记忆?关于相似性度量的“质量”是什么

首先问问你自己你想要什么样的相似性,出于什么目的,允许哪种排列/替换,等等,然后你将能够搜索一个“*-高效”的算法来计算适合你需要的度量

您可以从或查看差异开始,或在谷歌上搜索“字符串相似性度量”。

不幸的是,“高效”并不精确。在什么方面有效?时间记忆?关于相似性度量的“质量”是什么

首先问问你自己你想要什么样的相似性,出于什么目的,允许哪种排列/替换,等等,然后你将能够搜索一个“*-高效”的算法来计算适合你需要的度量

您可以从或查看差异开始,或在谷歌上搜索“字符串相似性度量”。

标准方法是

在中有一个实现:

标准方法是


Google中有一个实现:

Google似乎为您提供了许多潜在的解决方案。例如,您可以尝试以下方法:


谷歌搜索似乎为您提供了许多潜在的解决方案。例如,您可以尝试以下方法:


谢谢,我用过,而且你的答案是第一;)谢谢,我用过,而且你的答案是第一;)