Neo4j:性能问题
我们使用Neo4j 3.4企业版作为应用程序的数据存储。它运行在具有8核CPU和16GB RAM的EC2实例上 我们已上载这些数据集:Neo4j:性能问题,neo4j,Neo4j,我们使用Neo4j 3.4企业版作为应用程序的数据存储。它运行在具有8核CPU和16GB RAM的EC2实例上 我们已上载这些数据集: 销售:包括美元、折扣、数量和每卷价格等,根据品牌、周和业务单位等维度可视化 天气:由气温、降水量和降雪量组成,根据日、月和气象站的维度进行可视化 媒体:由事实支出、TRP和印象组成,根据维度周、业务单位、品牌、渠道、观众和活动进行可视化 这是我们设计的通用模型,可以容纳不同类型的数据集 该模型基于以下箭头图- 我们在其上运行的查询类型不依赖于数据集所属的应用
如果使用对终端节点进行编码的具体关系,我不会使用诸如
连接的或包含的一般关系。Neo4j可以更有效地预过滤这些关系。您的查询没有任何限制,它们会拉入整个数据库。这是故意的吗?你想实现什么?如果你使用对终端节点进行编码的具体关系,我不会使用像CONNECTED或CONTAINS这样的通用关系,Neo4j可以更有效地预过滤这些关系。-认可的。我们将进行更改并更新此线程。您的查询没有任何限制,它们将拖入整个数据库。这是故意的吗?你想要实现什么这是故意的。我们想让用户能够对上传的数十万个数据集执行连接。举个例子,用户在web应用程序UI上选择了一个名为“美元销售额”的变量。用户认为,如果她也有历史天气和消费者物价指数(CPI)数据,她可以改进对该变量的预测。现在这三个都是从不同的数据集上传到Neo4j的。每个数据集都有自己的粒度,我们可以在它们之间建立基于位置或时间的公共路径。每天的美元销售额为城市水平。天气/温度为每小时城市水平。CPI为每个季度的国家水平。她希望使用graph执行左连接的等效操作。在应用程序级别,我们必须生成相应的密码。这些节点可能位于图中的任何位置。如果用户希望根据特定时间(例如年/月)和/或位置(国家/城市)过滤返回的数据,我们会在Cypher中添加WHERE子句。