Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/search/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Search 评估搜索引擎:TREC的免费选择_Search_Open Source_Search Engine - Fatal编程技术网

Search 评估搜索引擎:TREC的免费选择

Search 评估搜索引擎:TREC的免费选择,search,open-source,search-engine,Search,Open Source,Search Engine,我正在评估几个开源搜索引擎。我想使用TREC数据收集(如WT10G)或企业数据收集来实现这一点 但似乎大多数数据集都非常昂贵(WT10G为500英镑)。这就是为什么我想问,是否有免费的TREC数据收集可以与开源搜索引擎(如Lucene)一起使用?如果没有,是否还有其他与TREC质量相同但免费的数据收集?古老的系统附带了一系列带有标记查询的测试收集,例如。这些集合不一定是免费的,因为它们允许出于任何目的分发(修改)版本,但它们是免费提供的。您可能需要做一些工作来破译文件格式,但它们是纯文本且有文档

我正在评估几个开源搜索引擎。我想使用TREC数据收集(如WT10G)或企业数据收集来实现这一点

但似乎大多数数据集都非常昂贵(WT10G为500英镑)。这就是为什么我想问,是否有免费的TREC数据收集可以与开源搜索引擎(如Lucene)一起使用?如果没有,是否还有其他与TREC质量相同但免费的数据收集?

古老的系统附带了一系列带有标记查询的测试收集,例如。这些集合不一定是免费的,因为它们允许出于任何目的分发(修改)版本,但它们是免费提供的。您可能需要做一些工作来破译文件格式,但它们是纯文本且有文档记录的


用于非商业用途,实际上是为了学习对实验进行排名,但可能对更一般的IR开发有用。

谢谢,FTP链接对我不起作用,但MS Research的数据看起来还不错。我会下载并让你知道。您是否知道TREC系列,您可以直接下载,而无需向您发送hdd或cd rom?不管它是否需要付费,但只需要相对快速地使用:)@Merlijn:不知道,对不起。无论如何,谢谢你的帮助suggestions@FredFoo:LETOR数据集能否用于评估信息检索系统(使用改进的tf idf的VSM)?我的意思是,它是否有一个基本事实(查询和相关文件等)