Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/cplusplus/146.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C++ C++;网站排名和搜索引擎库_C++_Search Engine_Web Crawler_Information Retrieval_Pagerank - Fatal编程技术网

C++ C++;网站排名和搜索引擎库

C++ C++;网站排名和搜索引擎库,c++,search-engine,web-crawler,information-retrieval,pagerank,C++,Search Engine,Web Crawler,Information Retrieval,Pagerank,谁能给我介绍一些包含网页排名算法的库,比如PageRank、HITS? 谢谢你除非你为谷歌工作,否则没有很多好的方法可以了解他们的页面排名算法的细节……这些算法会不时变化。维基百科概述了一些基本知识: 其他人写长篇文章: 如果您对编写搜索引擎所涉及的各种技术感兴趣,有几个主题。例如,有“网络爬网”,以及如何编写访问网站并获取其内容的程序……以及确定何时再次访问网站以查看其是否已更改: 一旦您的计算机上有大量数据要分析和搜索,要研究的主题领域称为“信息检索”(或“IR”): 这是一门相当新

谁能给我介绍一些包含网页排名算法的库,比如PageRank、HITS?
谢谢你

除非你为谷歌工作,否则没有很多好的方法可以了解他们的页面排名算法的细节……这些算法会不时变化。维基百科概述了一些基本知识:

其他人写长篇文章:

如果您对编写搜索引擎所涉及的各种技术感兴趣,有几个主题。例如,有“网络爬网”,以及如何编写访问网站并获取其内容的程序……以及确定何时再次访问网站以查看其是否已更改:

一旦您的计算机上有大量数据要分析和搜索,要研究的主题领域称为“信息检索”(或“IR”):

这是一门相当新的科学,但在这方面做了很多工作。维基百科有一个“免费搜索引擎软件”列表:

我建议,如果你是新手,那么最好先弄清楚如何使用Lucene之类的工具在你拥有的网站上提供搜索框。然后深入研究,看看它是如何工作的。它已经被移植到C++,如果这对你很重要:


我猜您指的是年发布的规范PageRank算法。现在人们使用“PageRank”来指代当前谷歌搜索的实际算法

如果真是这样,那么PageRank实现就不难找到和使用了。通过谷歌搜索,你可以找到大量的实现,比如说

对于HITS算法,有一个。还有一个


我还建议你开始胡闹。

我严重怀疑这样的库是否存在。AFAIK、PageRank等都是秘密算法。请注意,我已经重新标记了这个问题,所以它更有可能导致相关帖子包含有用的信息。您可以单击这些标记并浏览它们,或者混合它们。例如:谢谢你提供的完美信息。但我关注的是网络排名,它是网络信息检索的一部分。我需要一些排名算法的实现,如PageRank和其他,以便将它们的结果与我的结果进行比较。你可以尝试那些免费的搜索引擎软件链接,也许可以获得显示它们计算的排名的某种数据文件。但与谷歌的方法进行比较的唯一简单方法是制作样本数据集,然后使用谷歌网站搜索或购买谷歌搜索设备……输入不同的术语,并在相同的数据上比较他们的热门选择与你的热门选择:有一些著名的排名算法,如PageRank、HITS,。。。已经发表在许多论文中。我需要将我的结果与他们进行比较!我想要他们的实现!你知道吗?你已经看到了其他人看到的…发表在报纸上的一般描述。您还注意到,这些论文旁边没有发布源代码。除非你为谷歌工作,对谷歌搜索设备进行反向工程,或者参与某种工业间谍活动……否则你将无法访问他们搜索算法的来源。您可以将商业搜索引擎视为一个黑盒子并查看结果,也可以研究开源引擎的内部结构。这就是你所拥有的。但是clucene没有手册。你知道我在C++中怎么使用它吗?