Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/algorithm/11.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/search/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Algorithm 问题:需要在包含数百万个句子的数据库中查找一个句子吗?_Algorithm_Search_Full Text Search_Search Engine - Fatal编程技术网

Algorithm 问题:需要在包含数百万个句子的数据库中查找一个句子吗?

Algorithm 问题:需要在包含数百万个句子的数据库中查找一个句子吗?,algorithm,search,full-text-search,search-engine,Algorithm,Search,Full Text Search,Search Engine,因此,我将在数据库中存储数百万个句子,每个句子都有一个作者。我需要能够有效地搜索一个句子并返回作者。现在,我希望能够在这个句子中错误地说出一个单词或忘记一两个单词,并且应用程序仍然能够匹配(fuzzy-esque)。谁能给我指出正确的方向吗?谷歌是如何做到这一点的?因为我可以在谷歌上搜索歌词,例如,它会返回带有歌词的歌曲?我想做同样的事 谢谢大家 如果模糊使事情变得太复杂,那么我可以处理一个有效的句子搜索 SQL Server或Oracle上的全文索引很可能就是您想要的现成的索引。它们可以变得模

因此,我将在数据库中存储数百万个句子,每个句子都有一个作者。我需要能够有效地搜索一个句子并返回作者。现在,我希望能够在这个句子中错误地说出一个单词或忘记一两个单词,并且应用程序仍然能够匹配(fuzzy-esque)。谁能给我指出正确的方向吗?谷歌是如何做到这一点的?因为我可以在谷歌上搜索歌词,例如,它会返回带有歌词的歌曲?我想做同样的事

谢谢大家


如果模糊使事情变得太复杂,那么我可以处理一个有效的句子搜索

SQL Server或Oracle上的全文索引很可能就是您想要的现成的索引。它们可以变得模糊,使用词根和其他聪明的东西。
我不能对其他数据库引擎发表评论,尽管快速的谷歌显示大多数数据库引擎都有类似的功能。出于某种原因,我希望它们在模糊性方面会受到更大的限制。

SQL Server或Oracle上的全文索引很可能就是您想要的现成内容。它们可以变得模糊,使用词根和其他聪明的东西。
我不能对其他数据库引擎发表评论,尽管快速的谷歌显示大多数数据库引擎都有类似的功能。由于某些原因,我希望它们在模糊性方面受到更大的限制。

事实上,模糊匹配不是一件简单的事情,尽管有些数据库实现了某种模糊搜索,但根据使用的方法和数据,结果可能会有所不同。这里有一个链接解释SQL Server中的模糊搜索


至于句子搜索,大多数数据库引擎实现全文搜索/索引,您可能想看看。。。它在性能和存储方面进行了权衡,但您可能想看看它

事实上,模糊匹配并不是一件简单的事情,尽管有些数据库实现了某种模糊搜索,但根据所使用的方法和您的数据,您的结果可能会有所不同。这里有一个链接解释SQL Server中的模糊搜索


至于句子搜索,大多数数据库引擎实现全文搜索/索引,您可能想看看。。。它在性能和存储方面进行了权衡,但您可能想看看它

如果您是用Java编写的,您可以尝试一下


它真的应该是“文档”和作者而不是单个句子吗?

如果您是用Java编写的,您可以试试


它真的应该是“文档”和作者而不是单个句子吗?

对于全文搜索,请检查数据结构

搜索引擎就是这样做的

更新:
此外,如果您正在开发分布式系统,请检查Goolge的MapReduce的开源替代方案,以检查全文搜索数据结构

搜索引擎就是这样做的

更新: 另外,如果您正在开发分布式系统,请检查Goolge的MapReduce的开源替代方案

谷歌是如何做到这一点的

使用反向索引。细节是专有的,但你可以用最后的钱打赌,内存中有大量的索引复制和存储等,以便它们能够处理每秒收到的大量搜索请求

谷歌是如何做到这一点的


使用反向索引。细节是专有的,但你可以用最后的钱打赌,内存中有大量的索引复制和存储等,以便它们能够处理每秒收到的大量搜索请求。

Lucene可以与数据库集成吗?Lucene可以与数据库集成吗?