使用SPARQL和DBPedia测量主题之间的距离

使用SPARQL和DBPedia测量主题之间的距离,sparql,dbpedia,Sparql,Dbpedia,假设您有一个提到“土耳其”和“伊斯坦布尔”的文档,您希望提取这些关键字并将其与Wikipedia文章相匹配。但对“土耳其”来说,它可能意味着土耳其是一个国家,也可能意味着土耳其是一只鸟。那么,是否可以使用第二个关键字伊斯坦布尔来衡量它与右边“土耳其”之间的“距离”。因此: 伊斯坦布尔->土耳其国家->关闭 伊斯坦布尔->土耳其鸟->遥远 进一步解释距离的含义:据我所知,SPARQL可以遍历图,DBPedia是一种(知识)图,因此我要查找的距离可能在图中。如果资源之间存在唯一路径,则可以在SPAR

假设您有一个提到“土耳其”和“伊斯坦布尔”的文档,您希望提取这些关键字并将其与Wikipedia文章相匹配。但对“土耳其”来说,它可能意味着土耳其是一个国家,也可能意味着土耳其是一只鸟。那么,是否可以使用第二个关键字伊斯坦布尔来衡量它与右边“土耳其”之间的“距离”。因此:

伊斯坦布尔->土耳其国家->关闭

伊斯坦布尔->土耳其鸟->遥远


进一步解释距离的含义:据我所知,SPARQL可以遍历图,DBPedia是一种(知识)图,因此我要查找的距离可能在图中。

如果资源之间存在唯一路径,则可以在SPARQL中找到两个资源之间的路径长度。(这已经在很多地方进行了描述;例如,to。)但是,如果有多条路径连接端点,则不能使用该技术,因为它通过计算资源之间路径上的节点来工作,因此如果有多条路径,它将不会非常有用


在DBpedia中,任何一对资源之间都可能有很多路径,因此很难使用这种度量。不过,您可以使用的另一种方法是找到最接近的公共超类,并使用基于该超类的度量。该方法已在中讨论。

好的,这可能是我可以使用的方法。我在使用SPARQLWrapper时遇到了一个奇怪的问题。可能有点离题了,但你知道为什么在Virtuoso中会显示完全相同的查询:然后在SPARQLWrapper中:@MariusLian Hm,不,我不知道。有时,Virtuoso端点会施加超时和内存限制,因此这可能是在不同时间获得不同结果的原因。