elasticsearch 询问关于本体论和graphdb的问题
我只是使用Graphdb EE进行评估 我打算将我的bigdata从Cassandra迁移到Graphdb,但我阅读了文档,其中可以包含2^40实体=2000B实体。我对此有几个问题:
elasticsearch 询问关于本体论和graphdb的问题,
elasticsearch,graphdb,
elasticsearch,Graphdb,我只是使用Graphdb EE进行评估 我打算将我的bigdata从Cassandra迁移到Graphdb,但我阅读了文档,其中可以包含2^40实体=2000B实体。我对此有几个问题: 是一种扩展到无限实体的方法吗 我想使用多个存储库来管理我的数据,以及如何将它们连接起来作为单个repo使用 是否有方法搜索多个实体和多个属性(已在elasticsearch上索引)/实体 我是否需要创建每个ES连接器所有属性/每个实体以获得最佳性能 大卫,请看下面的快速回答 是一种扩展到无限实体的方法吗 2^40
大卫,请看下面的快速回答
同一回购协议可以有多个指数。提高性能的最佳方法是为那些对您最关键的查询设置特定索引(针对特定属性/具有特定筛选器的字段)。谢谢您回答我的问题。是的,因为我的数据非常大,将来可能会更大。所以我需要注意性能和数据存储。如果我有一个1B实体->SPARQL查询在这些实体上需要多长时间(David除外,是的,大多数查询应在不到1秒的时间内完成。查询性能并不太依赖于存储库的大小。即使是有1M个实体的回购,如果查询意味着全表扫描或笛卡尔积,也会导致查询速度变慢。推断是在更新时执行的,因此不会影响查询。如果您进入真正的大数据存储库大量的数据,您可以考虑在MunGDB中下载其中的一些,并使用GraphDB Mongo连接器,它允许您通过SPARQL查询Mongo中的数据。support@ontotext.com描述您的案例并获得推荐感谢您回答我的问题。如果我更新(CRUD内容、对象属性、数据属性)我的本体,我的数据仍然很好或面临一些问题?本体中的重大更改我触发推断或撤回推断语句,这在大型存储库上可能需要一段时间。即,相应的更新事务将需要一段时间-取决于更改的性质。这是基于物化的rea的代价另一方面,这是在大数据集上进行推理的唯一选择。众所周知,反向链接不能很好地工作,这有一个根本原因——它使得查询优化实际上不可能,因为缺乏每个查询模式的选择性统计数据。您的数据不会受到损害。使用规则集OWL2-RL和然后导入带有SWRL规则的本体owl2(它在Hermit Reasoner上工作),但graphdb无法推断从该SWRL规则提取的事实。我不知道为什么?