Rdf 获取所有维基百科个人条目的列表

Rdf 获取所有维基百科个人条目的列表,rdf,sparql,semantic-web,dbpedia,linked-data,Rdf,Sparql,Semantic Web,Dbpedia,Linked Data,Q:我正在试图获取维基百科上所有人的名单,以及他们的年龄、出生日期、死亡日期(如果有的话)和国家。 我正在使用这个dbpedia查询,它似乎只返回50000个结果,这绝对不是真的。这里缺少很多条目,例如-Mick Jagger等 SELECT ?person ?birthDate ?birthName ?occupation WHERE { ?person a <http://dbpedia.org/ontology/Person> . ?person dbpedia-owl:

Q:我正在试图获取维基百科上所有人的名单,以及他们的年龄、出生日期、死亡日期(如果有的话)和国家。

我正在使用这个dbpedia查询,它似乎只返回50000个结果,这绝对不是真的。这里缺少很多条目,例如-Mick Jagger等

SELECT ?person ?birthDate ?birthName ?occupation WHERE 
{
 ?person a <http://dbpedia.org/ontology/Person> .
 ?person dbpedia-owl:birthDate ?birthDate .
 ?person dbpedia-owl:birthName ?birthName .
 ?person dbpedia-owl:occupation ?occupation 
}
有人能为我提供一些如何完成任务的指导吗?我是第一次使用DBPedia,所以我可能遗漏了一些琐碎的东西


我需要尽可能多的关于地球上人的资料。(
可能是数百万人,包括他们的年龄、国家和出生日期,
)而且
50k是非常少的数字
,而且它还遗漏了一些我必须知道的名字

获得关于人的所有三重信息相对容易:

select ?s ?p ?o { ?s a dbpedia-owl:Person ; ?p ?o }
或者,您可以通过构造查询将结果作为RDF图返回:

construct where { ?s a dbpedia-owl:Person ; ?p ?o }

也就是说,您将达到公共DBpedia端点施加的一些合理限制。毕竟,你当地的图书馆可能会免费复印特定页数的书籍,但如果你盲目地要求复印大楼里的每一本自传,他们会以对其他读者不公平为由拒绝你。如果需要此类数据,您需要下载数据并在本地查询。

您是否已经阅读了第1.1节()中的合理使用政策?也许这些链接有帮助。我想你需要把你的问题分开。另一种选择是:下载完整的维基百科(例如,通过)并从本地副本中提取数据。我删除了关于“有人能告诉我一个正确的资源吗?”的部分,因为开放式资源请求与堆栈溢出无关。谢谢。。您还可以更新您的答案,了解如何将同一查询拆分为多个调用吗?可能每次通话可以得到5万美元。创建本地回购可能不是可行的选择。。知道了,偏移量是要使用的。无论如何,谢谢:-)如果您使用
偏移量
,那么您还需要使用
按顺序
;否则,就没有可预测的偏移顺序。@UditGupta您不能使用偏移和按顺序是什么意思?使用偏移量时,需要按顺序。不过,ORDER BY必须在OFFSET之前提交。例如,
选择*{…}按顺序。。。偏移量…
正常,但
选择*{…}偏移量。。。ORDER BY…
不是。@UditGupta请参阅以了解解决该问题的方法。您链接到的github问题实际上提供了一个解决方案,答案中的一个基本相同。
construct where { ?s a dbpedia-owl:Person ; ?p ?o }