Java 用于大型数据集的Triplestore

Java 用于大型数据集的Triplestore,java,rdf,triplestore,Java,Rdf,Triplestore,我想问一个适用于大型数据集的好的triplestore,它应该: 缩放井(百万个三倍) 有一个Java接口 你应该考虑使用这个商店。它可以通过开源许可证获得,并且可以扩展到数十亿个三倍。您可以通过Sesame和Jena API使用它 有关大型三联店的概述,请参阅。Virtuoso肯定比BigData更容易设置。除此之外,我还用了芝麻味的NativeStore,它的比例不太好 这也是一个不错的选择,虽然我还没用过。Virtuoso over 4Store的一个好处是,您可以轻松地将标准关系模型

我想问一个适用于大型数据集的好的triplestore,它应该:

  • 缩放井(百万个三倍)
  • 有一个Java接口

你应该考虑使用这个商店。它可以通过开源许可证获得,并且可以扩展到数十亿个三倍。您可以通过Sesame和Jena API使用它

有关大型三联店的概述,请参阅。Virtuoso肯定比BigData更容易设置。除此之外,我还用了芝麻味的NativeStore,它的比例不太好

这也是一个不错的选择,虽然我还没用过。Virtuoso over 4Store的一个好处是,您可以轻松地将标准关系模型与RDF混合使用,因为Virtuoso是一个关系数据库。

引用4store网站

4store的主要优势在于 性能、可扩展性和可扩展性 稳定性它并没有提供很多信息 RDF存储之上的功能 和SPARQL查询,但如果 寻找可扩展、安全、快速的 高效的RDF存储,然后是4store 应该在你的候选名单上

就我个人而言,我用非常大的数据库(多达20亿个三倍)测试了4store,结果非常好。4store是用C编写的,在Linux/Unix 64位平台上运行,当前版本1.1.1已经部分实现

4store可以部署在一个商品服务器集群上,这可以提高查询的性能,断言吞吐量可以达到每秒100 KTriples。但是,即使您在单个服务器中使用它,您也将获得相当不错的性能

<南安普敦大学>是我们在研究项目和我们的网站管理员团队中选择的非常大的数据集,请参阅

这里还有一个可用于查询和管理4store的所有库的列表。此外,它还有一个活跃的用户社区,如果您遇到任何问题,它将提供帮助


如果您是Linux/Unix用户,4store绝对是一个不错的选择

我也会推荐4store,但本着充分披露的精神,我是首席架构师:)

如果您想利用RDF存储的标准化,那么应该考虑使用实现SPARQL的Java库,而不是使用本机公开Java API的库


否则,由于在它们之间移动的努力,您可能最终会被您首先选择的任何存储卡住,这是典型的SQL迁移地狱。

我个人对此非常满意。它在中等硬件(256GB ram服务器)上运行良好,具有150亿个三倍的内存。这可以通过sesame和jena接口访问。(尽管耶拿是贝塔语)

如果你能负担得起,一个例子也不错。并且可能适合现有的oracle基础架构(备份等)


可扩展性非常好,可以以合理的成本处理庞大的数据量。不幸的是,它对SPARQL标准的遵从性参差不齐

@Steve-我不知道如何评论,所以我想我将立即回答两个问题

SPARQL的JDBC驱动程序如下:

支持SPARQL协议和SPARUL(作为更新通过SPARQL协议,而不是通过SPARUL协议)

@myahya

强烈推荐4Store,因此值得作为候选人进行评估

Virtuoso还拥有本地JDBC驱动程序,并支持大型数据集(多达120亿个三元组)

www.openlinksw.com/wiki/main/main/

此外,甲骨文也有一些东西,但要准备好支付大笔费用:


除了4Store、Virtuoso和Owlim之外,还值得一看。

+1一定要选择一个API(无论您的目标平台是什么)这是通用的/抽象的,因此在需要时移动到另一个存储相对来说比较容易,但是使用实现SPARQL的JAVA库不会导致性能差吗?这是一个经典的折衷方案,还是有库可以利用存储引擎的能力进行优化?@myahya Java库不需要实现SPARQL查询本身,只需要实现SPARQL协议,就可以以标准化的方式与三重存储进行通信。许多库还包括一个可以在本地使用的SPARQL实现,但这里我们指的是一个将查询发送到Triple Store的库,因此回答查询的是Triple Store(而不是库)。该库所做的只是将结果解析回您可以使用的对象with@RobV谢谢有什么特别的库可以推荐吗?@myahya我建议Jena(),因为它支持与基于SPARQL的远程服务器对话,并且如果您需要本地SPARQL查询,它有最先进的SPARQL实现