Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/search/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/ember.js/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Search 查询扩展测试的搜索查询示例集_Search_Search Engine_Stanford Nlp - Fatal编程技术网

Search 查询扩展测试的搜索查询示例集

Search 查询扩展测试的搜索查询示例集,search,search-engine,stanford-nlp,Search,Search Engine,Stanford Nlp,我正在处理一个查询扩展项目,希望在一个中等大小的查询集上测试它。我试着在网上查找,但找不到任何超过10万个的例子。有人能给我发一个链接,让我获得大约100万个示例查询。你要完成的具体任务是什么?如果目标只是生成大量的web查询,那么一个选项就是在给定一系列前缀的情况下对Google自动完成建议进行爬网。但是,据我所知,斯坦福大学CoreNLP没有任何工具来完成这项任务。你能澄清一下你是如何使用CoreNLP的吗?我在一组文档上使用word2vec来获取令牌的向量。给定一个查询,我将其标记化,使用

我正在处理一个查询扩展项目,希望在一个中等大小的查询集上测试它。我试着在网上查找,但找不到任何超过10万个的例子。有人能给我发一个链接,让我获得大约100万个示例查询。

你要完成的具体任务是什么?如果目标只是生成大量的web查询,那么一个选项就是在给定一系列前缀的情况下对Google自动完成建议进行爬网。但是,据我所知,斯坦福大学CoreNLP没有任何工具来完成这项任务。你能澄清一下你是如何使用CoreNLP的吗?我在一组文档上使用word2vec来获取令牌的向量。给定一个查询,我将其标记化,使用word2vec通过查询中每个标记的距离获取最近的标记。这是用于扩展的。我使用NLP使用词干分析器和解析器来修剪集合,以匹配相同的POS。好的,我们在查询扩展部分或word2vec方面帮不了什么忙,但是如果您在使用任何斯坦福工具(例如POS标记器)时遇到问题,请告诉我。