Sparql DBpedia似乎充满了错误

Sparql DBpedia似乎充满了错误,sparql,dbpedia,opendata,Sparql,Dbpedia,Opendata,我刚刚开始接触链接数据,当然还有DBpedia,希望它能对我的工作有所帮助 我只是想写一些SPARQL查询来熟悉数据和技术,但我对结果感到震惊,我想知道我是否没有得到一个核心概念。例如,如果我想DBpedia给我一个所有国家的列表,我会天真地想象,每个国家都是dbo:country类型的,而且如果某个国家是dbo:country类型的,那么该国家肯定是一个国家 因此,我猜返回所有国家的天真SPARQL查询将是 PREFIX dbo: <http://dbpedia.org/ontology

我刚刚开始接触链接数据,当然还有DBpedia,希望它能对我的工作有所帮助

我只是想写一些SPARQL查询来熟悉数据和技术,但我对结果感到震惊,我想知道我是否没有得到一个核心概念。例如,如果我想DBpedia给我一个所有国家的列表,我会天真地想象,每个国家都是dbo:country类型的,而且如果某个国家是dbo:country类型的,那么该国家肯定是一个国家

因此,我猜返回所有国家的天真SPARQL查询将是

PREFIX dbo: <http://dbpedia.org/ontology/>

SELECT ?concept
WHERE {?concept a dbo:Country}
现在,这个查询返回了很多我所期望的东西。现有国家、前国家、属于其他国家的国家,当然还有芬兰国家板球队

等等,什么

为什么这个问题会让芬兰国家板球队回心转意?当然,这不可能是一个国家类型的实体,是吗?让我看看

哦。可能是

我的理解是DBpedia的错误是正确的还是错误的?是否所有链接数据都受到异常值的类似污染?我的意思是,在我的提问中有更多奇怪的事情,比如英国篮球队、印第安纳民主党、美国驻巴基斯坦大使等等。这是一种已知的污染,还是我只是缺少了一个观点

我的理解是DBpedia的错误是正确的还是错误的

是的,我想是的。如果你仔细观察,你会发现芬兰国家板球队是dbo:dbr的国家:Jonathan_十月。我不太明白为什么会这样,但我认为这是问题的根源

是否所有链接数据都受到异常值的类似污染


我不这么认为,这总是取决于数据的来源。但是,如果它像是从维基百科自动提取数据,那么总是会有问题,尽管大多数时候希望不是在这个规模上。

顺便说一句,我已经在DBpedia mappings GitHub打开了。DBpedia是从维基百科提取的。维基百科充满了错误。修改维基百科,修改的内容最终会传到DBpedia。很快,他们就会被发现。