Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/search/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java中的最佳匹配搜索_Java_Search_Lucene_Search Engine - Fatal编程技术网

Java中的最佳匹配搜索

Java中的最佳匹配搜索,java,search,lucene,search-engine,Java,Search,Lucene,Search Engine,我有一个DB表,它存储Java中所有异常的列表及其描述。 当用户输入异常名称时,它将检索相应的描述。我使用了Levenshtein距离来匹配字符串,以防它们输入错误的字符串,但我希望从输入字符串中删除字符串搜索中不相关的单词,如“and”、“or”等,并提供快速搜索 是否有一个已经存在的框架或API用于在字符串列表上进行类似的搜索 有没有比Levenshtein距离更好的搜索字符串的方法?事实上,你有点错了。“和”和“或”等词与某些搜索引擎的工作方式极为相关;此外,正如您已经知道的,Levens

我有一个DB表,它存储Java中所有异常的列表及其描述。 当用户输入异常名称时,它将检索相应的描述。我使用了Levenshtein距离来匹配字符串,以防它们输入错误的字符串,但我希望从输入字符串中删除字符串搜索中不相关的单词,如“and”、“or”等,并提供快速搜索

是否有一个已经存在的框架或API用于在字符串列表上进行类似的搜索


有没有比Levenshtein距离更好的搜索字符串的方法?

事实上,你有点错了。“和”和“或”等词与某些搜索引擎的工作方式极为相关;此外,正如您已经知道的,Levenshtein距离是一种常见且有效的度量,允许您检查单词之间的相似性。此外,使用(可能是散列的)字典几乎是最快的。另外,如前所述,如果确实要过滤输入,请定义过滤规则,处理输入,然后使用结果字符串作为Levenshtein计算的基础

另外,我有点被激怒了,在这里发布了一个LMGTFY链接,因为实际上阅读维基百科关于Levenshtein的文章可以提供你可能需要的所有其他信息。我建议阅读更多关于所有距离度量和编辑距离的信息,在下面的链接中已经介绍的内容中,我没有什么可以补充的


来源:,

Bruce,你已经向Lucius Fox询问过这个问题了?,,,,,,,,,,,,,,“或”等等。要删除这些词,只需从google获取这些词的文本文件,然后在你的异常名称输入中找到这些词并将其删除。@swapnil7我需要更大的灵活性,我希望搜索即使在用户输入错误的情况下也能正常工作