Full text search 大型数据库实时索引的最佳实时搜索平台?

Full text search 大型数据库实时索引的最佳实时搜索平台?,full-text-search,real-time,near-real-time,Full Text Search,Real Time,Near Real Time,我正在建立一个站点atm,它需要对结果进行实时索引(不是每秒10000个文档,我指的是毫秒更新)。我研究了不同的技术,最初提出了几十种不同的平台。通过使用演绎法(文档复杂性、不同类型的支持等),我能够将我的选择范围缩小到大约3个: 朗讯 夏平 斯芬克斯 我最初试图通过使用它们的网站在这三者之间进行选择,但令我惊讶的是,越来越多的知名网站都信任这三者。我还发现,这三种方法都允许毫秒级更新 我最初想到Sphinx是因为它是三个系统中唯一一个说完全实时索引而不是近实时索引的系统,但却发现它仍处于测

我正在建立一个站点atm,它需要对结果进行实时索引(不是每秒10000个文档,我指的是毫秒更新)。我研究了不同的技术,最初提出了几十种不同的平台。通过使用演绎法(文档复杂性、不同类型的支持等),我能够将我的选择范围缩小到大约3个:

  • 朗讯
  • 夏平
  • 斯芬克斯
我最初试图通过使用它们的网站在这三者之间进行选择,但令我惊讶的是,越来越多的知名网站都信任这三者。我还发现,这三种方法都允许毫秒级更新

我最初想到Sphinx是因为它是三个系统中唯一一个说完全实时索引而不是近实时索引的系统,但却发现它仍处于测试阶段(不确定这项技术在实时索引tbh中有多可靠)

我倾向于lucene,因为当solr获得实时索引时,将我的模式移动到solr将非常容易

我也倾向于Xapian,因为我知道很多网站都很好地实现了它

我在决定这些技术和哪一种技术最适合我时遇到了巨大的问题

我正在寻找一个拥有数百万条甚至数千万条记录的站点,它需要一个可以实时追加/删除/更新的索引

有人能分享他们在实时搜索平台上的经验,帮助我选择适合我的搜索平台吗?我愿意接受这里没有的建议:)


注:我使用MongoDB,所以请不要只发布SQL搜索平台:)。

我会推荐基于lucene的搜索平台。

我用我发现的答案回答这个问题,几周后,这是最好的选择

我发现Lucene实际上是最好的,因为Zoies的用户群是…**。我想在谷歌集团(唯一的支持形式)上发布一个主题,但到目前为止,几个星期后,这个主题仍然没有得到审核和批准

这真的让我对佐伊不感兴趣,所以最后我决定试试卢森


无论如何,谢谢:)。

好样的post dude,现在开始研究:)我喜欢它在LinkedIn上的托管方式。再说一遍,你有没有其他语言(如PHP)通过curl使用Zoie的例子?我只是想知道我需要卷曲什么样的结构。