Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/search/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Search 搜索引擎中随机查询的优化_Search_Search Engine - Fatal编程技术网

Search 搜索引擎中随机查询的优化

Search 搜索引擎中随机查询的优化,search,search-engine,Search,Search Engine,我试图创建一个网站,返回一个随机有趣的网站。我这样做的方式是创建一个大的词库(超过10000个词),从中随机选择几个词,然后将它们发送到搜索引擎(Bing、Google等) 最初的单词库单词将由网站用户根据他们对网站的排名进行排名,然后从单词库中删除坏单词。在第一次查询结果之后,将对返回的网站集进行更多优化,以从中选择最佳网站 从一开始我需要的是一个单词的下降列表,这些单词很好,当与其他单词配对时,也会给出很多结果。有没有一个地方,我可以找到一个大名单的话,将返回更好的网站 所以,我要找的是一个

我试图创建一个网站,返回一个随机有趣的网站。我这样做的方式是创建一个大的词库(超过10000个词),从中随机选择几个词,然后将它们发送到搜索引擎(Bing、Google等)

最初的单词库单词将由网站用户根据他们对网站的排名进行排名,然后从单词库中删除坏单词。在第一次查询结果之后,将对返回的网站集进行更多优化,以从中选择最佳网站

从一开始我需要的是一个单词的下降列表,这些单词很好,当与其他单词配对时,也会给出很多结果。有没有一个地方,我可以找到一个大名单的话,将返回更好的网站

所以,我要找的是一个(非常大的)为搜索优化的单词列表,有人有想法吗


也许如果有人有很好的方法来创建随机查询,这也会很好,因为仅仅选择3个随机的英语单词并不能创建一个好的查询。

要获得为搜索而优化的单词列表,你可以在过去两年中的每个日期反复使用和调用它。

通过谷歌搜索“英语词汇表下载”


我希望这能有所帮助。

问题是,它提供的单词数量非常少,我正在寻找一个更大的单词库……这应该不是问题,因为您可以使用高级选项来获得各种结果,并且(正如我之前所说)针对不同的日期范围反复调用它(使用类似于HttpUnit的工具)为了得到你想要的大列表。我仍然在寻找至少10000个单词,其中大多数单词都是相同的,非常具体,比如谷歌、ipod、firefox、微软……看起来不错,但我正在寻找更多面向搜索的单词。。。我已经有了一个相当大的单词列表,只是太具体了,没有足够的通用性来进行一个好的搜索查询…所以要么检索到的单词太笼统,要么根据@sinha的msg,它们太重复了。你要么有一个手动任务在你前面从单词列表中选择,要么你可以依靠谷歌(like)的输出。或者你知道shell编程吗<代码>排序文件1文件2文件3 | uniq>allUniqWords可能是一个开始。然后做一个随机选择单词的脚本?否则,按照sinha的建议执行,并对输出应用相同的唯一化过程。如果你有更好的解决方案,请张贴答案,并给自己打上绿色的复选标记;-)!祝你好运,@sinha的答案的问题是,这些词并不是真的那么好,它们主要是(正如我告诉他的)谷歌、Facebook和其他著名的非常大的网站。问题不是我不能“统一”结果,而是我认为当我这样做的时候,我只剩下10个唯一的结果。你的答案要好一点,单词列表更大,但它并没有完全解决问题,也就是说,当从列表中选择查询时,结果的质量不是很好。这可能是我最好的选择,但我想再等一段时间,看看我是否能得到更好的答案。重读你的问题,我想你是在寻找bi和trig(2和3个单词集),对吗?查看了
。/insights/search/#
的输出,虽然它们是多词目标,但我明白你的意思,困难!接下来的挑战是找到可能在搜索查询中找到的2个和3个单词分组的来源。一个更难的问题。也许雅虎或更小的商业搜索引擎可以访问提交的查询的全文。然后对输出进行非齐化。祝你好运