Database 图形数据库与带有链接/桥接表的RDB

Database 图形数据库与带有链接/桥接表的RDB,database,database-design,neo4j,graph-databases,data-warehouse,Database,Database Design,Neo4j,Graph Databases,Data Warehouse,我从事欺诈/AML(反洗钱)领域的工作,我们正在探索使用图形数据库挖掘隐藏的连接和链接。我最近阅读了大量的图形数据库(主要是neo4j,但我认为不同产品的概念是相似的?),从我所能看出,它们似乎非常适合这个领域。问题是我很难得到技术管理层的认可,因为他们似乎认为我们可以用Hadoop中现有的数据报告模型做同样的事情,它本质上是一个数据仓库,有特定的表,在核心表之间提供多对多链接表(我相信金宝称之为“桥牌”桌子?) 在某种程度上,它们似乎提供了与图形数据库中的关系表相同的功能。鉴于我们已经在Had

我从事欺诈/AML(反洗钱)领域的工作,我们正在探索使用图形数据库挖掘隐藏的连接和链接。我最近阅读了大量的图形数据库(主要是neo4j,但我认为不同产品的概念是相似的?),从我所能看出,它们似乎非常适合这个领域。问题是我很难得到技术管理层的认可,因为他们似乎认为我们可以用Hadoop中现有的数据报告模型做同样的事情,它本质上是一个数据仓库,有特定的表,在核心表之间提供多对多链接表(我相信金宝称之为“桥牌”桌子?)


在某种程度上,它们似乎提供了与图形数据库中的关系表相同的功能。鉴于我们已经在Hadoop中构建了链接表,图形数据库是否会为我们想要做的事情(例如,客户a如何连接到客户B)提供性能优势,或者我们是否通过构建所有链接表在很大程度上否定了graph DB的任何性能优势?

在类似的硬件平台上,关系数据库在执行“路径间”查询时永远无法跟上构造良好的graph数据库。决不能

每个图形数据库产品都有自己的内部存储表示形式,但它们基本上都是为了存储节点和边并支持跨这些节点和边的导航查询而设计的。如果不添加新的图形支持功能,关系数据库将很难提供类似图形的功能

使用本机图形数据库的另一个优点是,图形查询语言专门设计用于支持查询之间的路径。在Objective/DB(一种大规模可扩展和可分发的对象/图形数据库)中,我们可以使用DO查询语言查找两个实体之间的所有路径,最高可达指定的度数apart以毫秒或秒为单位。DO查询可能如下所示:

Match p = (:Account { accountId = "1234"})
          -[*..100]->
          (:Account { accountId = "5678"})
          return p;
这里,我们要说的是:找到从帐户1234到帐户5678的所有路径(p),它们之间的间隔在1到100度之间

在关系数据库中创建和执行相同的查询将更加复杂(不向数据库中添加图形功能),在关系数据库中执行类似的查询将更加占用资源(内存、cpu、I/O)

如果您有机会为您的项目浏览图形数据库,请确保您了解您的可扩展性和数据分发要求。这些信息将是选择正确产品的关键

免责声明:我是客观的现场操作总监