Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/search/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Search 应该使用哪种开源搜索引擎?_Search_Open Source_Information Retrieval - Fatal编程技术网

Search 应该使用哪种开源搜索引擎?

Search 应该使用哪种开源搜索引擎?,search,open-source,information-retrieval,Search,Open Source,Information Retrieval,我的目标是建立一个新闻提要和博客提要的聚合器,以便 搜索/跟踪it中的实体很容易。我一直在寻找很多解决方案,比如Terrier、Lucene、SWISH-E等 基本上,我只能找到两个来源的比较研究做这些引擎,其中一个是有点过时。基本上,我想要一个搜索引擎,它将在数据大小不是太大的情况下使用,但索引将是频繁的,每30分钟左右。我觉得在这种情况下,Terrier不是一个好工具。当数据量较大且更新频率较低时,它工作得更好。在信息检索领域工作过的人能提供一些建议吗 Lucene是众所周知并得到支持的,所

我的目标是建立一个新闻提要和博客提要的聚合器,以便 搜索/跟踪it中的实体很容易。我一直在寻找很多解决方案,比如Terrier、Lucene、SWISH-E等


基本上,我只能找到两个来源的比较研究做这些引擎,其中一个是有点过时。基本上,我想要一个搜索引擎,它将在数据大小不是太大的情况下使用,但索引将是频繁的,每30分钟左右。我觉得在这种情况下,Terrier不是一个好工具。当数据量较大且更新频率较低时,它工作得更好。在信息检索领域工作过的人能提供一些建议吗

Lucene是众所周知并得到支持的,所以就我个人而言,这将是我的第一选择。

如果你找到一个现成的搜索引擎,请查看fastcatsearch

它是为商业搜索而开发的,并应用于许多不同的网站

比lucene更快,并且具有易于使用的基于web的web管理器


托管在github中,并查看它

他似乎同意你的看法——如果我的主要目的是做研究,而Lucene并没有以不同的相似性/评分算法的形式提供太多,那该怎么办。除了Terrier之外,还有什么学术开源引擎可以试用吗?Lucene确实允许对评分进行相当多的操作。邮件列表中的一些搜索应该会带来一些信息。对于Lucene,几乎没有什么是你不能做的。为了获得更好的性能,请尝试查看clucene(C++中的Lucene)-