Seo 如何评估搜索引擎?

Seo 如何评估搜索引擎?,seo,search-engine,pagerank,Seo,Search Engine,Pagerank,我是一名学生,正在进行一项研究,以增强搜索引擎的现有算法 我想知道如何评估我改进过的搜索引擎,以量化算法改进了多少 我应该如何比较新旧算法 谢谢为了评估某样东西,你必须定义你对它的期望。这将有助于定义如何测量它。 然后,您将能够衡量改进情况。 关于搜索引擎,我想你可以衡量它的查找能力,以及它返回相关信息的准确性。 这是一个有趣的挑战。你必须清楚地识别积极和消极的品质,比如一个人能以多快的速度得到他们想要的答案,或者在得到答案的过程中有多少“错误”的答案。如果正确答案是#5,但返回的结果快了20倍

我是一名学生,正在进行一项研究,以增强搜索引擎的现有算法

我想知道如何评估我改进过的搜索引擎,以量化算法改进了多少

我应该如何比较新旧算法


谢谢

为了评估某样东西,你必须定义你对它的期望。这将有助于定义如何测量它。
然后,您将能够衡量改进情况。

关于搜索引擎,我想你可以衡量它的查找能力,以及它返回相关信息的准确性。


这是一个有趣的挑战。

你必须清楚地识别积极和消极的品质,比如一个人能以多快的速度得到他们想要的答案,或者在得到答案的过程中有多少“错误”的答案。如果正确答案是#5,但返回的结果快了20倍,这是一种进步吗?对于每个应用程序,类似的事情都会有所不同。在企业知识库搜索中,正确答案可能更为重要,但电话支持应用程序可能需要快速答案


没有参数,任何测试都不能称为胜利

这通常是通过创建一套测试问题,然后评估搜索响应对这些问题的回答程度来完成的。在某些情况下,响应应该是明确的(如果你在搜索引擎中键入
slashdot
,你希望得到
slashdot.org
作为你的热门搜索),因此你可以将其视为一类具有“正确”答案的硬查询

大多数其他查询本质上是主观的。为了最大限度地减少偏见,你应该让多个用户尝试你的搜索引擎,并对结果进行评分,以便与原始结果进行比较。下面是一篇计算机科学论文的例子,它做了类似的事情:

关于算法的具体比较,虽然很明显,但您衡量的内容取决于您对了解什么感兴趣。例如,您可以比较计算效率、内存使用率、爬网开销或返回结果的时间。如果您试图产生非常具体的行为,例如对某些参数运行专家搜索(例如文献搜索),那么您需要明确地测试这一点


相关性启发式也是一种有用的检查方法。例如,当有人使用可能与“编程相关”的搜索词时,您是否倾向于从
stackoverflow.com
获得更多结果?如果你这样做了,你的搜索结果会更好吗?如果您要为特定站点或域提供一组信任权重(例如,将
.edu
.ac.uk
域评级为技术结果更可信),那么您需要测试这些权重的有效性。

如果这是您的目标,我认为您不会找到最终的数学解决方案。为了给给定的算法打分,您需要必须达到的标准和目标

  • 你的基准是什么
  • 你认为什么是“改进的”
  • 你认为“成功的搜索”是什么?
  • 你的测试团队有多大
  • 你的测试是什么
例如,如果您的目标是改进页面排名过程,那么请确定您是在判断算法的效率还是准确性。判断效率意味着您对代码进行计时,以获得一致的大数据集并记录结果。然后,您将使用您的算法来改进时间

如果你的目标是提高准确性,那么你需要定义什么是“不准确的”。如果你搜索“Cup”,你只能说提供的第一个网站是“最好的”,如果你自己能准确地定义什么是“Cup”的最佳答案


我给你的建议是缩小你实验的范围。定义一个或两个你认为需要改进的搜索引擎品质,并努力改进它们。

在你的评论中“我听说过一种衡量搜索引擎质量的方法,通过计算用户在找到他想要的链接之前需要点击后退按钮的次数,但我可以使用这种技术,因为你需要用户来测试你的搜索引擎,这本身就是一个头痛的问题“好吧,如果你把你的引擎免费放在网上几天,做一点广告,你可能至少会得到几十次尝试。”。随机向这些用户提供旧版本或新版本,并测量这些点击


其他可能性:假设谷歌的定义是完美的,并将你的答案与它的某些查询进行比较。(例如,如果你的第二个链接是谷歌的第十二个链接,那么这就是10个距离)。这是一个巨大的假设,但要实现起来容易得多。

首先,让我先说一句,感谢您尝试将传统研究方法应用于搜索引擎结果。很多SEO都在你之前做过这件事,并且通常会把这件事留给他们自己,因为分享“惊人的发现”通常意味着你不能再利用或占据上风,这意味着我会尽我所能分享一些需要寻找的指针和东西

  • 确定您试图改进算法的哪一部分?
  • 不同的搜索执行不同的算法

    广泛搜索

    例如,在广义search中,引擎往往会返回各种结果。这些结果的共同部分包括

  • 新闻提要
  • 产品
  • 图像
  • 博客帖子
  • 本地结果(基于地理IP查找)
  • 这些结果类型中的哪一种会根据单词的不同而有所不同

    示例:猫返回猫的图像,新闻、鞋子返回当地的鞋子购物。(这是基于我10月6日在芝加哥的IP)

    r中的目标