Algorithm 哪一个是维基百科最快的图形表示?

Algorithm 哪一个是维基百科最快的图形表示?,algorithm,api,graph,wikipedia,wikipedia-api,Algorithm,Api,Graph,Wikipedia,Wikipedia Api,我正在做这个项目,我需要在代表英文维基百科文章的图形上运行一些图形算法。这需要是实时的 我试过了 它只有一个PHP接口 它的速度不如前一个,但是有一个Python接口 我想知道是否有一些明显的快速Java/Python API我错过了,而且更好?您尝试了什么?这些看起来很有希望:@NoBugs对此表示抱歉。我对问题进行了编辑,以包含我尝试过的内容。这是否意味着图中的顶点是一篇文章,而有向边是两篇文章之间的超链接?通过XML解析器运行XML转储,然后在每个文章正文中搜索regex\[(.*)\

我正在做这个项目,我需要在代表英文维基百科文章的图形上运行一些图形算法。这需要是实时的

我试过了

  • 它只有一个PHP接口
  • 它的速度不如前一个,但是有一个Python接口

我想知道是否有一些明显的快速Java/Python API我错过了,而且更好?

您尝试了什么?这些看起来很有希望:@NoBugs对此表示抱歉。我对问题进行了编辑,以包含我尝试过的内容。这是否意味着图中的顶点是一篇文章,而有向边是两篇文章之间的超链接?通过XML解析器运行XML转储,然后在每个文章正文中搜索regex
\[(.*)\]
以查找链接是相当容易的。@AndrewTomazos理解这是大量数据,并将其放在内存中并不理想。理想情况下,它需要一个数据库和一些缓存实现,以提供良好的速度/较低的内存使用率。图形本身可以很容易地放入内存,比gig小得多。整个xml转储仅为30gig。一个简单的内存中无缓存表示将比任何数据库都快得多。