使用DBPedia提取Wikipedia信息框数据的SPARQL查询

使用DBPedia提取Wikipedia信息框数据的SPARQL查询,sparql,wikipedia,dbpedia,Sparql,Wikipedia,Dbpedia,如何使用DBPedia提取Wikipedia页面的infobox数据?如果有人能直接向我提供我可以在DBPedia端点运行的查询,以获取作为属性值的键值对的infobox内容,那就太好了。比如说, 查询圣雄甘地应该返回如下结果: 出生日期:1869-10-02 出生名:莫汉达斯·K·甘地, 休息地点:德里, 死亡日期:1948-01-30 由于这只是我正在进行的项目的一小部分,因此我避免深入讨论SPARQL等的细节。假设您的URI是dbpedia.org/resource/Mahatma_G

如何使用DBPedia提取Wikipedia页面的infobox数据?如果有人能直接向我提供我可以在DBPedia端点运行的查询,以获取作为属性值的键值对的infobox内容,那就太好了。比如说,

查询圣雄甘地应该返回如下结果:

出生日期:1869-10-02 出生名:莫汉达斯·K·甘地,
休息地点:德里,
死亡日期:1948-01-30


由于这只是我正在进行的项目的一小部分,因此我避免深入讨论SPARQL等的细节。

假设您的URI是dbpedia.org/resource/Mahatma_Gandhi(来自en.wikipedia.org/wiki/Mahatma_Gandhi),您可以简单地执行以下操作:

select * {
<http://dbpedia.org/resource/Mahatma_Gandhi> dbpedia-owl:birthDate ?birthDate;
dbpedia-owl:birthName ?name;
dbpedia-owl:restingPlace ?restingPlace;
dbpedia-owl:deathDate ?deathDate
 }
选择*{
dbpedia猫头鹰:生日?生日;
dbpedia猫头鹰:出生名?姓名;
dbpedia猫头鹰:restingPlace?restingPlace;
dbpedia猫头鹰:死亡日期?死亡日期
}
试穿

如果你想查询其他资源,我建议你这样做

select * {
<http://dbpedia.org/resource/Mahatma_Gandhi> dbpedia-owl:birthName ?name.
OPTIONAL{<http://dbpedia.org/resource/Mahatma_Gandhi> dbpedia-owl:birthDate ?birthDate}
OPTIONAL{<http://dbpedia.org/resource/Mahatma_Gandhi> dbpedia-owl:restingPlace ?restingPlace}
OPTIONAL{<http://dbpedia.org/resource/Mahatma_Gandhi> dbpedia-owl:deathDate ?deathDate}
}
选择*{
dbpedia猫头鹰:出生名?名字。
可选{dbpedia owl:birthDate?birthDate}
可选{dbpedia owl:restingPlace?restingPlace}
可选{dbpedia owl:deathDate?deathDate}
}

您可以通过一个请求提取有关甘地的所有数据:

describe <http://dbpedia.org/resource/Mahatma_Gandhi> 描述
然后选择结果格式。

对不起,堆栈溢出不是“给我代码”服务。@svick-Yup,我理解。我试图编写自己的解析器,解析通过WikimediaAPI接收的数据,以提取infobox。不幸的是,鉴于infobox模板数量巨大,这种方法并不是傻瓜式的,而且保证适用于所有类型的盒子。因此,我们正在寻找使用DBPedia快速解决问题的方法。:)是否有理由使用
dbpedia owl:
前缀,但避免使用
dbpedia:
前缀,这样会使
dbpedia:Mahatma\u Gandhi
更易于键入和阅读?@dvcama谢谢,答案很有帮助。但是,有没有一种方法可以获取整个infobox数据,而不必像上面提到的“生日”、“休息地”、“死亡日期”那样明确提到每个属性。比如,你指定了资源:“圣雄甘地”,你就得到了该资源的所有属性和值。我需要一系列的信息框,从“尼罗河”到“圣雄甘地”再到“细菌”,所以很难明确地提到这些属性。嗨,正如Gabriel所写的,你可以做一个描述查询,我更喜欢使用
select*{?p?o}
,因为我不想要反向关系