Algorithm 问题:需要在包含数百万个句子的数据库中查找一个句子吗?
因此,我将在数据库中存储数百万个句子,每个句子都有一个作者。我需要能够有效地搜索一个句子并返回作者。现在,我希望能够在这个句子中错误地说出一个单词或忘记一两个单词,并且应用程序仍然能够匹配(fuzzy-esque)。谁能给我指出正确的方向吗?谷歌是如何做到这一点的?因为我可以在谷歌上搜索歌词,例如,它会返回带有歌词的歌曲?我想做同样的事 谢谢大家Algorithm 问题:需要在包含数百万个句子的数据库中查找一个句子吗?,algorithm,search,full-text-search,search-engine,Algorithm,Search,Full Text Search,Search Engine,因此,我将在数据库中存储数百万个句子,每个句子都有一个作者。我需要能够有效地搜索一个句子并返回作者。现在,我希望能够在这个句子中错误地说出一个单词或忘记一两个单词,并且应用程序仍然能够匹配(fuzzy-esque)。谁能给我指出正确的方向吗?谷歌是如何做到这一点的?因为我可以在谷歌上搜索歌词,例如,它会返回带有歌词的歌曲?我想做同样的事 谢谢大家 如果模糊使事情变得太复杂,那么我可以处理一个有效的句子搜索 SQL Server或Oracle上的全文索引很可能就是您想要的现成的索引。它们可以变得模
如果模糊使事情变得太复杂,那么我可以处理一个有效的句子搜索 SQL Server或Oracle上的全文索引很可能就是您想要的现成的索引。它们可以变得模糊,使用词根和其他聪明的东西。
我不能对其他数据库引擎发表评论,尽管快速的谷歌显示大多数数据库引擎都有类似的功能。出于某种原因,我希望它们在模糊性方面会受到更大的限制。SQL Server或Oracle上的全文索引很可能就是您想要的现成内容。它们可以变得模糊,使用词根和其他聪明的东西。
我不能对其他数据库引擎发表评论,尽管快速的谷歌显示大多数数据库引擎都有类似的功能。由于某些原因,我希望它们在模糊性方面受到更大的限制。事实上,模糊匹配不是一件简单的事情,尽管有些数据库实现了某种模糊搜索,但根据使用的方法和数据,结果可能会有所不同。这里有一个链接解释SQL Server中的模糊搜索
至于句子搜索,大多数数据库引擎实现全文搜索/索引,您可能想看看。。。它在性能和存储方面进行了权衡,但您可能想看看它事实上,模糊匹配并不是一件简单的事情,尽管有些数据库实现了某种模糊搜索,但根据所使用的方法和您的数据,您的结果可能会有所不同。这里有一个链接解释SQL Server中的模糊搜索
至于句子搜索,大多数数据库引擎实现全文搜索/索引,您可能想看看。。。它在性能和存储方面进行了权衡,但您可能想看看它如果您是用Java编写的,您可以尝试一下
它真的应该是“文档”和作者而不是单个句子吗?如果您是用Java编写的,您可以试试
它真的应该是“文档”和作者而不是单个句子吗?对于全文搜索,请检查数据结构 搜索引擎就是这样做的 更新:
此外,如果您正在开发分布式系统,请检查Goolge的MapReduce的开源替代方案,以检查全文搜索数据结构 搜索引擎就是这样做的 更新: 另外,如果您正在开发分布式系统,请检查Goolge的MapReduce的开源替代方案 谷歌是如何做到这一点的 使用反向索引。细节是专有的,但你可以用最后的钱打赌,内存中有大量的索引复制和存储等,以便它们能够处理每秒收到的大量搜索请求 谷歌是如何做到这一点的
使用反向索引。细节是专有的,但你可以用最后的钱打赌,内存中有大量的索引复制和存储等,以便它们能够处理每秒收到的大量搜索请求。Lucene可以与数据库集成吗?Lucene可以与数据库集成吗?