elasticsearch 询问关于本体论和graphdb的问题,elasticsearch,graphdb,elasticsearch,Graphdb" /> elasticsearch 询问关于本体论和graphdb的问题,elasticsearch,graphdb,elasticsearch,Graphdb" />

elasticsearch 询问关于本体论和graphdb的问题

elasticsearch 询问关于本体论和graphdb的问题,elasticsearch,graphdb,elasticsearch,Graphdb,我只是使用Graphdb EE进行评估 我打算将我的bigdata从Cassandra迁移到Graphdb,但我阅读了文档,其中可以包含2^40实体=2000B实体。我对此有几个问题: 是一种扩展到无限实体的方法吗 我想使用多个存储库来管理我的数据,以及如何将它们连接起来作为单个repo使用 是否有方法搜索多个实体和多个属性(已在elasticsearch上索引)/实体 我是否需要创建每个ES连接器所有属性/每个实体以获得最佳性能 大卫,请看下面的快速回答 是一种扩展到无限实体的方法吗 2^40

我只是使用Graphdb EE进行评估

我打算将我的bigdata从Cassandra迁移到Graphdb,但我阅读了文档,其中可以包含2^40实体=2000B实体。我对此有几个问题:

  • 是一种扩展到无限实体的方法吗

  • 我想使用多个存储库来管理我的数据,以及如何将它们连接起来作为单个repo使用

  • 是否有方法搜索多个实体和多个属性(已在elasticsearch上索引)/实体

  • 我是否需要创建每个ES连接器所有属性/每个实体以获得最佳性能


  • 大卫,请看下面的快速回答

  • 是一种扩展到无限实体的方法吗 2^40表示1T实体。你真的需要更多吗

    GraphDB中的实体是图形中的节点:URI、文本、空白列表。平均而言,每个节点都有多个边/语句(比如5x)

  • 我想使用多个存储库来管理我的数据,以及如何将它们连接起来作为单个repo使用
  • 是的,请参阅所谓的,它允许您在SPARQL查询中高效地跨同一GraphDB实例中的存储库进行联合

  • 是否有方法搜索多个实体和多个属性(已在elasticsearch上索引)/实体
  • 我不确定我是否理解你的问题。您完全可以在单个SPARQL查询中嵌入多个FTS查询。这些FTS查询可以使用不同的字段搜索不同的实体。你可以阅读更多关于这方面的内容

  • 我是否需要创建每个ES连接器所有属性/每个实体以获得最佳性能
    同一回购协议可以有多个指数。提高性能的最佳方法是为那些对您最关键的查询设置特定索引(针对特定属性/具有特定筛选器的字段)。

    谢谢您回答我的问题。是的,因为我的数据非常大,将来可能会更大。所以我需要注意性能和数据存储。如果我有一个1B实体->SPARQL查询在这些实体上需要多长时间(David除外,是的,大多数查询应在不到1秒的时间内完成。查询性能并不太依赖于存储库的大小。即使是有1M个实体的回购,如果查询意味着全表扫描或笛卡尔积,也会导致查询速度变慢。推断是在更新时执行的,因此不会影响查询。如果您进入真正的大数据存储库大量的数据,您可以考虑在MunGDB中下载其中的一些,并使用GraphDB Mongo连接器,它允许您通过SPARQL查询Mongo中的数据。support@ontotext.com描述您的案例并获得推荐感谢您回答我的问题。如果我更新(CRUD内容、对象属性、数据属性)我的本体,我的数据仍然很好或面临一些问题?本体中的重大更改我触发推断或撤回推断语句,这在大型存储库上可能需要一段时间。即,相应的更新事务将需要一段时间-取决于更改的性质。这是基于物化的rea的代价另一方面,这是在大数据集上进行推理的唯一选择。众所周知,反向链接不能很好地工作,这有一个根本原因——它使得查询优化实际上不可能,因为缺乏每个查询模式的选择性统计数据。您的数据不会受到损害。使用规则集OWL2-RL和然后导入带有SWRL规则的本体owl2(它在Hermit Reasoner上工作),但graphdb无法推断从该SWRL规则提取的事实。我不知道为什么?