Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/361.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 如何从mssql表中识别包含类似文本的记录_Java_Sql Server - Fatal编程技术网

Java 如何从mssql表中识别包含类似文本的记录

Java 如何从mssql表中识别包含类似文本的记录,java,sql-server,Java,Sql Server,我有一个包含多条记录的表格,这些记录具有不同或相似或部分相似的文本 例如: 记录1:堆栈溢出论坛非常有用。这在很大程度上帮助了开发人员和研究人员。 记录2:有几个非常有用的论坛可以帮助开发人员和研究人员 记录3:这个堆栈溢出论坛非常有用。这在很大程度上帮助了开发人员和研究人员。 记录4:不应考虑该文本 考虑记录1和记录3,它们都是相同的,并且在我为记录生成哈希代码时被标记为重复 记录4包含完全不同的文本 看看记录1和记录2,它们的意思基本相似,包含的单词也几乎相似 比较两个记录时,这两个记录中相

我有一个包含多条记录的表格,这些记录具有不同或相似或部分相似的文本

例如:

记录1:堆栈溢出论坛非常有用。这在很大程度上帮助了开发人员和研究人员。 记录2:有几个非常有用的论坛可以帮助开发人员和研究人员

记录3:这个堆栈溢出论坛非常有用。这在很大程度上帮助了开发人员和研究人员。 记录4:不应考虑该文本

考虑记录1和记录3,它们都是相同的,并且在我为记录生成哈希代码时被标记为重复

记录4包含完全不同的文本

看看记录1和记录2,它们的意思基本相似,包含的单词也几乎相似

比较两个记录时,这两个记录中相似单词的百分比更大

所以我需要根据百分比提取这些类型的记录

是否有与java相关的算法来执行此操作


如果我能得到一些指导,这将对我很有用。

您可以使用模糊字符串搜索来搜索您的需求。 也许我能帮你。
或者,对于数据库中的搜索,也可以使用Hibernate搜索。请参见

您的实际问题是:我需要一个Java算法来计算字符串相似性。另外90%的问题文本是不相关的。我建议你先用谷歌搜索一下,因为在这里询问资源是不合适的。