对Neo4j的并发写入

对Neo4j的并发写入,neo4j,Neo4j,我有一个远程运行的Neo4j实例(它位于Azure虚拟机中) 我有大量的数据要填充到图中:大约1M个节点,每个节点可能有大约100个关系 如果我从本地机器添加这些节点,我可以每小时添加大约1000个节点,也就是说,填充图形大约需要1000个小时 我可以分发上传,例如运行多个Azure Worker将数据并行推送到Neo 我的问题是:尼奥能处理这个问题吗?特别是,单个节点可能与尚未创建的节点有新的关系,并将创建它们—所有创建操作都使用cypher MERGE 如果尼奥对此感到满意,那太好了。如果没

我有一个远程运行的Neo4j实例(它位于Azure虚拟机中)

我有大量的数据要填充到图中:大约1M个节点,每个节点可能有大约100个关系

如果我从本地机器添加这些节点,我可以每小时添加大约1000个节点,也就是说,填充图形大约需要1000个小时

我可以分发上传,例如运行多个Azure Worker将数据并行推送到Neo

我的问题是:尼奥能处理这个问题吗?特别是,单个节点可能与尚未创建的节点有新的关系,并将创建它们—所有创建操作都使用cypher MERGE


如果尼奥对此感到满意,那太好了。如果没有,是否有任何框架/最佳实践会有所帮助?

我知道这并不能直接回答您的问题,但为什么不直接在本地加载数据集,然后在VMS上交换数据集呢?顺便说一句,每小时1000个节点的速度似乎非常慢,即使remotelyNeo4j每秒也可以在本地接收多达一百万个节点,所以似乎有什么事情真的不对劲。请准确分享您的工作内容和数据摄取方式。您的标签/属性组合是否有索引/约束?请准确分享您的工作内容和数据摄取方式。您可以编写代码、语句、原始数据示例等,否则没有人可以帮助您。