Sparql DBpedia结果随时间而变化

Sparql DBpedia结果随时间而变化,sparql,rdf,semantic-web,dbpedia,linked-data,Sparql,Rdf,Semantic Web,Dbpedia,Linked Data,2016年1月,作为项目的一部分,我使用jena framework对DBpedia进行了一次查询,以统计100部电影的不同属性。我昨天在写报告,所以我试图确认结果,但令人惊讶的是,结果发生了变化。一月份,我有100多处房产,昨天有63处。我用同样的查询同样的一切 我甚至在一月份在硬盘上保存了属性标签列表,确认有100多个。我检查了DBpedia上是否仍然使用所有这些资源来描述电影资源,我发现很多都不是。我还查看了他们网站的变更日志,这是我发现的唯一相关内容,页面()上写着: 我们现在从原始In

2016年1月,作为项目的一部分,我使用jena framework对DBpedia进行了一次查询,以统计100部电影的不同属性。我昨天在写报告,所以我试图确认结果,但令人惊讶的是,结果发生了变化。一月份,我有100多处房产,昨天有63处。我用同样的查询同样的一切

我甚至在一月份在硬盘上保存了属性标签列表,确认有100多个。我检查了DBpedia上是否仍然使用所有这些资源来描述电影资源,我发现很多都不是。我还查看了他们网站的变更日志,这是我发现的唯一相关内容,页面()上写着:

我们现在从原始Infobox提取器中过滤出三个 已映射。例如,不再使用“dbo:出生地”和 dbp:出生地| dbp:同一资源中的出生地|…”。这些 三元组现在移动到“infobox属性映射”数据集并 未在主端点上加载。详见第22期

你认为这是原因吗,或者你知道对此的任何解释吗

我使用的查询:

select (count(distinct ?pr) AS ?count) where {
    ?su ?pr ?ob .
        select ?su{
        ?su a <http://schema.org/Movie> .
        }
    limit 100

}
选择(count(distinct?pr)作为?count),其中{
苏普洛布。
选择?苏{
苏阿。
}
限制100
}

谢谢。

上周有一个新的DBpedia版本,因此,公共端点只包含最新的数据集

我认为,关于数据中的所有更改,变更日志并不完整。当然,您提到的注释减少了单个资源的属性数量,但是在没有看到您的查询的情况下,我不能说任何其他内容


如果您确实需要旧数据,您仍然可以下载转储并将其加载到本地triple store。

请注意,无论您使用的是基于HTTP的SPARQL端点、Jena/Java/JDBC、ODBC还是其他,公共服务的资源限制(查询超时、结果行数等)都适用

另外,我很确定您没有使用这里和现在看到的查询,因为它使用了无效的语法

尽管如此,您还是可以尝试正确的查询


(最后一个数据集肯定还没有用新的DBpedia数据集更新,但可能随时都会更新,因此采用免责声明将符合您的最佳利益。例如,“这是一个公开可编辑的、动态的数据集,由不断发展的代码库从维基百科中提取,因此结果可能(也将,并且已经)随时间而变化。”)

我已经更新了问题,并包含了查询。代码的其余部分是一个简单的结果集显示。你认为我可以用我发表的评论作为解释(在你看来)?因为我负担不起重新开始,房产的数量只是更大操作的输入。因此,我需要证明,如果你在不同的时间尝试相同的想法,为什么它可能会给你不同的结果。“这是一个公开的可编辑、动态的数据集,由不断发展的代码库从Wikipedia中提取,因此结果可能(并且将会)随时间而变化。”一个可能的原因是服务器正在截断结果-DBpedia有一些资源限制,并且查询可能会扫描数据库的重要部分。要消除这种情况,请尝试在不同的时间和不同的日子。如果63个主题每次都是一样的,那就不太可能是资源限制。事实上,我想到了这一点,所以我试着列出1000个主题,没有问题。而且,当您在公共端点上运行查询时,通常会应用该限制。我正在使用一个java/jena程序。我想这就是为什么
我们现在从原始Infobox提取器中过滤出三元组…
在您获得更多的属性之前synonyms@jimkont是的,我想可能是这样。它不仅仅是同义词,以前存在的一些资源中还缺少一些属性,例如:评级、发布数据。。etc@M20-请注意,无论您使用的是基于HTTP的SPARQL端点、Jena/Java/JDBC、ODBC还是其他,公共服务的资源限制(查询超时、结果行数等)都适用。另外,我很确定您没有使用这里和现在看到的查询,因为它使用了无效的语法。也就是说,您可以尝试对……进行正确的查询……除了免责声明之外,还可以引用特定的DBpedia版本,因为转储至少在最新版本中可用。