Machine learning 使用无监督的点击日志评估搜索引擎

Machine learning 使用无监督的点击日志评估搜索引擎,machine-learning,search-engine,information-retrieval,data-science,Machine Learning,Search Engine,Information Retrieval,Data Science,我有用户在我的网站上搜索的日志,他们键入了哪些搜索,点击了哪些结果。我想改进搜索算法。但首先我需要一种方法来衡量它的质量 我知道我可以通过Amazon Turk等收集数据,并让人们制作一个测试套件。然而,我想使用我的网站日志中已有的数据 有人能告诉我怎么做,用哪种算法吗 谢谢 这实际上是一个大话题,经常使用一种叫做交错的在线评估技术。您是只拥有Web服务器日志,还是还创建自定义搜索日志?谷歌分析 有关以系统为中心的搜索引擎评估的介绍性概述,以及该主题的其他工作,请参阅Mounia Lalmas的

我有用户在我的网站上搜索的日志,他们键入了哪些搜索,点击了哪些结果。我想改进搜索算法。但首先我需要一种方法来衡量它的质量

我知道我可以通过Amazon Turk等收集数据,并让人们制作一个测试套件。然而,我想使用我的网站日志中已有的数据

有人能告诉我怎么做,用哪种算法吗


谢谢

这实际上是一个大话题,经常使用一种叫做交错的在线评估技术。您是只拥有Web服务器日志,还是还创建自定义搜索日志?谷歌分析

有关以系统为中心的搜索引擎评估的介绍性概述,以及该主题的其他工作,请参阅Mounia Lalmas的幻灯片:

我想出于实际目的,你可以看看丹尼尔·通克朗的这篇文章:


您可以查看第一次单击结果的位置(平均Recipopal排名),或者如果重建工作太多,只需单击次数就可以了。这会给你一个基线。考虑到您的域和应用程序的设置方式,您可以查看单击后采取行动(预订、购买、联系等)的频率(转换率)。如果你的网站有一些流量,你可以做一些A/B测试,哪些流量会导致更高的点击率和/或转化率。

非常感谢!这两种我都试试