Rdf 获取所有维基百科个人条目的列表_Rdf_Sparql_Semantic Web_Dbpedia_Linked Data

Rdf 获取所有维基百科个人条目的列表

rdf sparql

Rdf 获取所有维基百科个人条目的列表,rdf,sparql,semantic-web,dbpedia,linked-data,Rdf,Sparql,Semantic Web,Dbpedia,Linked Data,Q：我正在试图获取维基百科上所有人的名单，以及他们的年龄、出生日期、死亡日期（如果有的话）和国家。我正在使用这个dbpedia查询，它似乎只返回50000个结果，这绝对不是真的。这里缺少很多条目，例如-Mick Jagger等 SELECT ?person ?birthDate ?birthName ?occupation WHERE { ?person a <http://dbpedia.org/ontology/Person> . ?person dbpedia-owl:

Q：我正在试图获取维基百科上所有人的名单，以及他们的年龄、出生日期、死亡日期（如果有的话）和国家。

我正在使用这个dbpedia查询，它似乎只返回50000个结果，这绝对不是真的。这里缺少很多条目，例如-Mick Jagger等

SELECT ?person ?birthDate ?birthName ?occupation WHERE 
{
 ?person a <http://dbpedia.org/ontology/Person> .
 ?person dbpedia-owl:birthDate ?birthDate .
 ?person dbpedia-owl:birthName ?birthName .
 ?person dbpedia-owl:occupation ?occupation 
}

有人能为我提供一些如何完成任务的指导吗？我是第一次使用DBPedia，所以我可能遗漏了一些琐碎的东西

我需要尽可能多的关于地球上人的资料。（

可能是数百万人，包括他们的年龄、国家和出生日期，

）而且

50k是非常少的数字

，而且它还遗漏了一些我必须知道的名字

获得关于人的所有三重信息相对容易：

select ?s ?p ?o { ?s a dbpedia-owl:Person ; ?p ?o }

或者，您可以通过构造查询将结果作为RDF图返回：

construct where { ?s a dbpedia-owl:Person ; ?p ?o }

也就是说，您将达到公共DBpedia端点施加的一些合理限制。毕竟，你当地的图书馆可能会免费复印特定页数的书籍，但如果你盲目地要求复印大楼里的每一本自传，他们会以对其他读者不公平为由拒绝你。如果需要此类数据，您需要下载数据并在本地查询。

您是否已经阅读了第1.1节（）中的合理使用政策？也许这些链接有帮助。我想你需要把你的问题分开。另一种选择是：下载完整的维基百科（例如，通过）并从本地副本中提取数据。我删除了关于“有人能告诉我一个正确的资源吗？”的部分，因为开放式资源请求与堆栈溢出无关。谢谢。。您还可以更新您的答案，了解如何将同一查询拆分为多个调用吗？可能每次通话可以得到5万美元。创建本地回购可能不是可行的选择。。知道了，偏移量是要使用的。无论如何，谢谢：-）如果您使用

偏移量

，那么您还需要使用

按顺序

；否则，就没有可预测的偏移顺序。@UditGupta您不能使用偏移和按顺序是什么意思？使用偏移量时，需要按顺序。不过，ORDER BY必须在OFFSET之前提交。例如，

选择*{…}按顺序。。。偏移量…

正常，但

选择*{…}偏移量。。。ORDER BY…

不是。@UditGupta请参阅以了解解决该问题的方法。您链接到的github问题实际上提供了一个解决方案，答案中的一个基本相同。

construct where { ?s a dbpedia-owl:Person ; ?p ?o }