Janus Graph后端cassandra vs Bigtable

Janus Graph后端cassandra vs Bigtable,cassandra,janusgraph,bigtable,Cassandra,Janusgraph,Bigtable,我计划使用Janusgraph来构建我们团队处理的不同用途的图形,我看到janus graph可以选择使用BigTable或Cassandra作为存储后端。我正在寻找任何关于哪个后端更优/性能的建议(我主要谈论的是节点的2跳邻居上的gremlin查询性能) 我知道性能是非常主观的,并且根据数据大小/图形连接和用例而变化,所以最好的方法是自己尝试,我正计划这样做。但是,还有其他人做过类似的性能比较吗?这里有关于存储后端的一般建议吗?您说得对,性能是: 主观的 很大程度上取决于数据大小 我可以告

我计划使用Janusgraph来构建我们团队处理的不同用途的图形,我看到janus graph可以选择使用BigTable或Cassandra作为存储后端。我正在寻找任何关于哪个后端更优/性能的建议(我主要谈论的是节点的2跳邻居上的gremlin查询性能)


我知道性能是非常主观的,并且根据数据大小/图形连接和用例而变化,所以最好的方法是自己尝试,我正计划这样做。但是,还有其他人做过类似的性能比较吗?这里有关于存储后端的一般建议吗?

您说得对,性能是:

  • 主观的
  • 很大程度上取决于数据大小
我可以告诉你,我也做了这个练习。为此,我认为与大家分享这个比较很重要

就性能而言,我要看的最大的事情是如何处理一致性。一般来说,执行更高级别一致性的数据库通常必须牺牲性能

  • BigTable==强一致性
  • 卡桑德拉==最终一致
其他值得考虑的因素是,BigTable限制您使用谷歌云(GCP)。如果您不想在网络上失去性能,还需要为GCP上的更多(Janus)实例支付数据本地性费用

就原始数据库引擎“得分”而言,Cassandra目前为114.112,而BigTable则为微不足道的3.582。这些分数每月都会变化,但总的来说,这意味着卡桑德拉周围有一个更强大的社区。同样,卡桑德拉在这个网站上有18182个问题,而BigTable只有449个。底线是,这将更容易获得支持和问题的答案

基于社区的潜在实力,卡桑德拉是这里更好的选择


在过去的几年里,我一直支持JanusGraph在Cassandra上的应用,我可以告诉你,总体来说,它是可靠的。大容量数据加载往往会带来困难。但除此之外,一切似乎都很顺利。

谢谢您的回复。您能否提供更多关于您提到的“批量数据加载”问题的详细信息?您是在谈论高写入速率的问题,还是在执行大容量读取/查询操作(如OLAP用例)?@Vishal具体来说,JanusGraph的Spark连接器在高写入吞吐量方面存在问题。