Algorithm Pagerank及其数学:需要解释
我是一个对开发一个搜索引擎感兴趣的学生,该引擎可以索引来自我国的页面。我已经研究了一段时间使用的算法,我已经确定点击率和PageRank是最好的。我决定使用PageRank,因为它比HITS算法更稳定(或者我已经读过) 我发现了无数与PageRank相关的文章和学术论文,但我的问题是我不理解这些论文中形成算法的大多数数学符号。具体来说,我不明白谷歌矩阵(不可约的随机矩阵)是如何计算的 我的理解基于以下两篇文章:Algorithm Pagerank及其数学:需要解释,algorithm,math,search,pagerank,Algorithm,Math,Search,Pagerank,我是一个对开发一个搜索引擎感兴趣的学生,该引擎可以索引来自我国的页面。我已经研究了一段时间使用的算法,我已经确定点击率和PageRank是最好的。我决定使用PageRank,因为它比HITS算法更稳定(或者我已经读过) 我发现了无数与PageRank相关的文章和学术论文,但我的问题是我不理解这些论文中形成算法的大多数数学符号。具体来说,我不明白谷歌矩阵(不可约的随机矩阵)是如何计算的 我的理解基于以下两篇文章: 有没有人能用较少的数学符号提供一个基本的解释(举例就好了) 提前感谢。这是你
提前感谢。这是你需要的论文:(如果你不认识作者的名字,你可以在这里找到更多关于他们的信息:) 本文件中使用的符号在本文件中以非专业英语描述
谢谢你让我用谷歌搜索这个。引用文件第4页定义的PageRank的正式定义,在数学方程中用有趣的“E”符号表示(实际上是大写的Sigma希腊字母。Sigma是字母“S”,这里代表总和) 简而言之,这个公式表示,要计算第X页的PageRank… For all the backlinks to this page (=all the pages that link to X) you need to calculate a value that is The PageRank of the page that links to X [R'(v)] divided by the number of links found on this page. [Nv] to which you add some "source of rank", [E(u)] normalized by c (we'll get to the purpose of that later.) And you need to make the sum of all these values [The Sigma thing] and finally, multiply it by a constant [c] (this constant is just to keep the range of PageRank manageable) 对于指向此页面的所有反向链接(=链接到X的所有页面) 您需要计算一个 链接到X[R'(v)]的页面的PageRank 除以 在此页上找到的链接数。[Nv] 你加进去的 一些“秩的来源”[E(u)]被c规范化 (稍后我们将讨论其目的。) 你需要把所有这些值相加[西格玛值] 最后,乘以一个常数[c] (此常量仅用于保持PageRank的范围可管理) 这个公式的关键思想是,链接到给定页面X的所有网页都在为其“价值”增加价值。通过链接到某个页面,他们正在“投票”支持该页面。然而,这一“投票”的分量多少取决于两个因素:
- 链接到X[R'(v)]
- 事实上,链接到X的页面也链接到许多其他页面。[Nv]
- 一般来说,从该领域公认的专家那里得到推荐信比从一个不知名的人那里得到推荐信要好
- 不管是谁推荐,他们也会推荐给其他人,这会降低他们推荐给你的价值
我希望这有点帮助…如果你真的想为搜索引擎开发一个算法,我会郑重地建议你学习线性代数课程。由于没有亲自参加的课程,Gilbert Strang的麻省理工开放式课程相当不错(在上的视频讲座) 像这样的课程肯定能让你理解你提供的文档中的数学符号——在那篇论文中,没有什么是第一年的线性代数课程不能涵盖的
我知道这不是你想要的答案,但它确实是你最好的选择。在你没有很好地掌握基本概念的情况下,让某人尝试向你解释单个符号或算法并不能很好地利用任何人的时间。你可能还想阅读关于数学的介绍性教程d大卫·奥斯汀(David Austin)写的Pagerank矩阵的构造,题为