Search 应该使用哪种开源搜索引擎?
我的目标是建立一个新闻提要和博客提要的聚合器,以便 搜索/跟踪it中的实体很容易。我一直在寻找很多解决方案,比如Terrier、Lucene、SWISH-E等Search 应该使用哪种开源搜索引擎?,search,open-source,information-retrieval,Search,Open Source,Information Retrieval,我的目标是建立一个新闻提要和博客提要的聚合器,以便 搜索/跟踪it中的实体很容易。我一直在寻找很多解决方案,比如Terrier、Lucene、SWISH-E等 基本上,我只能找到两个来源的比较研究做这些引擎,其中一个是有点过时。基本上,我想要一个搜索引擎,它将在数据大小不是太大的情况下使用,但索引将是频繁的,每30分钟左右。我觉得在这种情况下,Terrier不是一个好工具。当数据量较大且更新频率较低时,它工作得更好。在信息检索领域工作过的人能提供一些建议吗 Lucene是众所周知并得到支持的,所
基本上,我只能找到两个来源的比较研究做这些引擎,其中一个是有点过时。基本上,我想要一个搜索引擎,它将在数据大小不是太大的情况下使用,但索引将是频繁的,每30分钟左右。我觉得在这种情况下,Terrier不是一个好工具。当数据量较大且更新频率较低时,它工作得更好。在信息检索领域工作过的人能提供一些建议吗 Lucene是众所周知并得到支持的,所以就我个人而言,这将是我的第一选择。如果你找到一个现成的搜索引擎,请查看fastcatsearch 它是为商业搜索而开发的,并应用于许多不同的网站 比lucene更快,并且具有易于使用的基于web的web管理器
托管在github中,并查看它 他似乎同意你的看法——如果我的主要目的是做研究,而Lucene并没有以不同的相似性/评分算法的形式提供太多,那该怎么办。除了Terrier之外,还有什么学术开源引擎可以试用吗?Lucene确实允许对评分进行相当多的操作。邮件列表中的一些搜索应该会带来一些信息。对于Lucene,几乎没有什么是你不能做的。为了获得更好的性能,请尝试查看clucene(C++中的Lucene)-