Sparql DBpedia中类和属性的总数

Sparql DBpedia中类和属性的总数,sparql,rdf,dbpedia,Sparql,Rdf,Dbpedia,好吧,这似乎是一个非常基本的问题,但出于某种原因,我无法理解。我有来自的DBpedia 2014 owl文件。现在,当我加载它并查看Ontology metrics选项卡时,我看到类计数是814,对象属性计数是1310,数据属性计数是1725。这是正确的号码吗?出于好奇,我尝试检查Virtuoso端点上的数字和查询 select ?p (count(?p) as ?totalCount) where {?s ?p ?o } group by ?p order by DESC(?totalCoun

好吧,这似乎是一个非常基本的问题,但出于某种原因,我无法理解。我有来自的DBpedia 2014 owl文件。现在,当我加载它并查看Ontology metrics选项卡时,我看到类计数是814,对象属性计数是1310,数据属性计数是1725。这是正确的号码吗?出于好奇,我尝试检查Virtuoso端点上的数字和查询

select ?p (count(?p) as ?totalCount) where {?s ?p ?o } group by ?p order by DESC(?totalCount)
i、 试图找到属性和它们在图表中出现的总次数,我发现总数是10000。现在我不确定这是否是检查属性以及它们在图形中出现的次数的正确方法

对于发出此查询时的类:

SELECT ?class 
WHERE {
   ?class rdf:type rdfs:Class.
}
我一点结果也没有。现在使用Virtuoso中的默认查询,即

Select count(distinct ?Concept) where {[] a ?Concept}
我得到的值是369857。所以我有点困惑。这个数字如此之大是因为图表中有来自yago、umbel、schema.org和purl的概念,还是我看错了什么?这些概念与课程完全不同吗?(解释不同,我没有想到)

老实说,这些数字阻碍了我,因为我需要它们来计算本文中定义的选择性


这里,假设对于三重模式,主题的选择性是
1/R
,其中R是资源的数量,那么资源是指类计数还是概念计数?或者是
?s?p?o
中的
s
计数。三重模式?

DBpedia本体仅包含命名空间为
http://dbpedia.org/ontology

DBpedia SPARQL端点包含更多数据:

首先,它包含具有名称空间
http://dbpedia.org/property
。这些属性是非类型化的(即类型
rdf:Property
),这实际上意味着值可以是资源或文本。在OWL中,我们有类型化属性,即对象和数据属性

加载到SPARQL端点的其他信息包括指向外部数据集的链接,如YAGO或上层本体UMBEL。您可以在此处找到更多详细信息

顺便说一句,您可以从第一次查询中很容易地看到这一点。有更多具有不同名称空间的属性

根据您的第一个查询:如果您想要每个属性的三元组数,那么这是正确的查询。它只返回10000,因为这是加载DBpedia的Virtuoso三元组存储的默认结果集限制。要获得更多结果,您必须使用分页。三元组中使用的属性总数可以通过

SELECT  (COUNT(DISTINCT ?p) AS ?cnt)
WHERE
  { ?s ?p ?o}
第二次对所有
rdf:Class
类型的类的查询不返回任何内容,因为DBpedia中没有属于该类型的类。更常见的是对owl本体查询类型为
owl:Class
的类。第三次查询实际上返回对象位置中出现在
rdf:type
三元组中的所有资源,这一点很小当它处理实例数据时,它是不同的。这意味着它返回数据中实际使用的所有类


关于你的最后一个问题。我还没有读过这篇论文,但在许多研究论文中,一个常见的度量标准通常是使用使用给定属性的不同主题。

DBpedia本体只包含命名空间为
http://dbpedia.org/ontology

DBpedia SPARQL端点包含更多数据:

首先,它包含具有名称空间
http://dbpedia.org/property
。这些属性是非类型化的(即类型为
rdf:Property
),这实际上意味着值可以是资源或文本。在OWL中,我们有类型化属性,即对象和数据属性

加载到SPARQL端点的其他信息包括指向外部数据集的链接,如YAGO或上层本体UMBEL。您可以在此处找到更多详细信息

顺便说一句,您可以从第一次查询中很容易地看到这一点。有更多具有不同名称空间的属性

根据您的第一个查询:如果您想要每个属性的三元组数,那么这是正确的查询。它只返回10000,因为这是加载DBpedia的Virtuoso三元组存储的默认结果集限制。要获得更多结果,您必须使用分页。三元组中使用的属性总数可以通过

SELECT  (COUNT(DISTINCT ?p) AS ?cnt)
WHERE
  { ?s ?p ?o}
第二次对所有
rdf:Class
类型的类的查询不返回任何内容,因为DBpedia中没有属于该类型的类。更常见的是对owl本体查询类型为
owl:Class
的类。第三次查询实际上返回对象位置中出现在
rdf:type
三元组中的所有资源,这一点很小当它处理实例数据时,它是不同的。这意味着它返回数据中实际使用的所有类


关于你的最后一个问题。我还没有读过这篇论文,但在许多研究论文中,一个常见的衡量标准通常是使用使用给定属性的不同主题。

非常感谢@AKSW花时间回答这个问题。这真的很有帮助!非常感谢@AKSW花时间回答这个问题。这真的很有帮助!