Performance 在Google Compute Engine/Amazon EC2实例上使用Neo4j的最佳实践

Performance 在Google Compute Engine/Amazon EC2实例上使用Neo4j的最佳实践,performance,amazon-ec2,neo4j,disk,google-compute-engine,Performance,Amazon Ec2,Neo4j,Disk,Google Compute Engine,在为Neo4j优化linux机器方面有一个很好的解决方案。但本指南假设了物理硬盘驱动器的典型特征。我正在Google CE和Amazon EC2上运行我的Neo4j实例。我找不到任何详细说明这些虚拟机最佳设置的文档。在内存(用于堆或扩展使用)和磁盘速度/IOPS方面,我需要哪些资源才能获得最佳性能?我目前有几百万个节点和大约一千万个关系(2GB),数据大小随着导入而增加 在EC2上,我曾经依赖SSD暂存磁盘,然后定期备份到永久磁盘。在计算引擎上没有这样的东西,而且写入速度在我看来也不是很高,至少

在为Neo4j优化linux机器方面有一个很好的解决方案。但本指南假设了物理硬盘驱动器的典型特征。我正在Google CE和Amazon EC2上运行我的Neo4j实例。我找不到任何详细说明这些虚拟机最佳设置的文档。在内存(用于堆或扩展使用)和磁盘速度/IOPS方面,我需要哪些资源才能获得最佳性能?我目前有几百万个节点和大约一千万个关系(2GB),数据大小随着导入而增加

在EC2上,我曾经依赖SSD暂存磁盘,然后定期备份到永久磁盘。在计算引擎上没有这样的东西,而且写入速度在我看来也不是很高,至少在正常的磁盘大小下是这样的(因为)。有没有办法在导入/索引操作中获得合理的性能?或者这些操作更多地与内存和计算能力有关


欢迎任何附加阅读…

尽可能使用本地磁盘,SSD比其他更好,请尝试在AWS上配置ops

EBS不是一个很好的匹配,它是缓慢和紧张的

不过,对于计算引擎并没有什么概念,您可能需要使用更多的RAM,然后尝试将图形的较大部分加载到内存中

补充阅读:

你还是应该看看那篇博文中提到的其他东西。比如Linux调度器、写屏障等

最好手动设置这些内存映射设置。对于第二级缓存,可以使用hpc缓存查看企业版


另请参见本网络研讨会:关于硬件规模的

这是一篇优秀的文章。如果我的内存足够容纳整个数据库,我是否需要调整内存映射设置以使Neo4j将数据保留在内存中?回答自己:显然,如果有足够的内存可用,可以使用cache_type=strong。参考:还有一个更详细的答案@