Search 查询扩展测试的搜索查询示例集
我正在处理一个查询扩展项目,希望在一个中等大小的查询集上测试它。我试着在网上查找,但找不到任何超过10万个的例子。有人能给我发一个链接,让我获得大约100万个示例查询。你要完成的具体任务是什么?如果目标只是生成大量的web查询,那么一个选项就是在给定一系列前缀的情况下对Google自动完成建议进行爬网。但是,据我所知,斯坦福大学CoreNLP没有任何工具来完成这项任务。你能澄清一下你是如何使用CoreNLP的吗?我在一组文档上使用word2vec来获取令牌的向量。给定一个查询,我将其标记化,使用word2vec通过查询中每个标记的距离获取最近的标记。这是用于扩展的。我使用NLP使用词干分析器和解析器来修剪集合,以匹配相同的POS。好的,我们在查询扩展部分或word2vec方面帮不了什么忙,但是如果您在使用任何斯坦福工具(例如POS标记器)时遇到问题,请告诉我。Search 查询扩展测试的搜索查询示例集,search,search-engine,stanford-nlp,Search,Search Engine,Stanford Nlp,我正在处理一个查询扩展项目,希望在一个中等大小的查询集上测试它。我试着在网上查找,但找不到任何超过10万个的例子。有人能给我发一个链接,让我获得大约100万个示例查询。你要完成的具体任务是什么?如果目标只是生成大量的web查询,那么一个选项就是在给定一系列前缀的情况下对Google自动完成建议进行爬网。但是,据我所知,斯坦福大学CoreNLP没有任何工具来完成这项任务。你能澄清一下你是如何使用CoreNLP的吗?我在一组文档上使用word2vec来获取令牌的向量。给定一个查询,我将其标记化,使用