Algorithm 从RDF获取数据的高效遍历/搜索算法?

Algorithm 从RDF获取数据的高效遍历/搜索算法?,algorithm,search,data-structures,rdf,sparql,Algorithm,Search,Data Structures,Rdf,Sparql,我将数据作为数据库中的RDF图,并使用SPARQL检索数据。现在,图中的节点(对象)变得巨大,遍历/搜索变得慢得多 a。有人能推荐有效的遍历/搜索算法来获取数据吗 作为下一步,我将使用联邦数据,即来自外部应用程序(如SAP)的数据。在这种情况下,搜索速度会慢得多 b。在这种情况下,我应该使用什么有效的搜索算法 这似乎是大型企业系统中的一个常见问题,任何关于如何在此类系统中解决这些问题的信息都会有所帮助。图形遍历和高效查询是一个范围广泛的问题,使用的方法取决于您的情况。我建议考虑像Neo4j这样的

我将数据作为数据库中的RDF图,并使用SPARQL检索数据。现在,图中的节点(对象)变得巨大,遍历/搜索变得慢得多

a。有人能推荐有效的遍历/搜索算法来获取数据吗

作为下一步,我将使用联邦数据,即来自外部应用程序(如SAP)的数据。在这种情况下,搜索速度会慢得多

b。在这种情况下,我应该使用什么有效的搜索算法


这似乎是大型企业系统中的一个常见问题,任何关于如何在此类系统中解决这些问题的信息都会有所帮助。

图形遍历和高效查询是一个范围广泛的问题,使用的方法取决于您的情况。我建议考虑像Neo4j这样的数据存储,并用Lucene这样的工具来补充它

我也有类似的问题。我使用SPARQL属性路径进行了大量图形遍历,但使用基于RDF的存储库速度太慢。我用的是Jena TDB,应该很快,但还是太慢了

就像@Mikos建议的那样,我试过Neo4J。然后它变得更快了。就像马克·沃森在电视上说的

RDF数据存储支持SPARQL查询:适合匹配数据中的模式

Neo4j支持任意图形结构,似乎最适合探索 图的邻域:从一个节点开始,探索连接的 节点。(图形遍历)

我使用了Neo4j,但您可以尝试为图形遍历构建的任何工具。我读到Allegrograph 4是基于RDF的,具有良好的图形遍历速度


现在我使用Neo4j,但我没有放弃RDF。我仍然使用URI作为标识符,并尝试重用流行的rdf词汇表和关系。稍后,我将添加一个特性,将我的gaphs呈现为RDF。我知道,使用Neo4j,您也可以使用Tinkerpop渲染RDF,但我自己还没有尝试过。

想澄清一下您在搜索什么以及目前是如何进行的吗?在不知道你目前正在做什么的情况下,很难提出改进建议。下层选民是否愿意详细说明?或者只是度过了糟糕的一天?我想这是因为你的回答与OP的问题无关,完全没有提到他使用RDF和SPARQL的部分。这实际上非常相关,也是我的研究主题。我是根据我结合Neo4J+lucene的经验提出建议的——该平台在叠加多个图遍历算法方面提供了最大的灵活性。