Graph 使用ApacheGiraph作为具有大量数据的Neo4j

Graph 使用ApacheGiraph作为具有大量数据的Neo4j,graph,neo4j,bigdata,graph-databases,giraph,Graph,Neo4j,Bigdata,Graph Databases,Giraph,我试着在Neo4j上进行一些测试,计算两个节点之间的最短路径 有100k个节点和1000万条边(每个节点100条边),最短路径算法在0.4-3秒内运行 对于200k个节点和4000万条边(每个节点200条边),它至少需要40秒或更长时间 我的电脑显然不是用于大数据分析的,但我甚至不知道购买一台128GB内存的服务器和一堆处理器是否能在合理的时间内解决第二次测试。(你认为可以吗?) 当然,对于100万个或更多的节点,neo4j将不再帮助我了。 我花了很多时间在网上寻找像Neo4J这样的Giraph

我试着在Neo4j上进行一些测试,计算两个节点之间的最短路径

  • 有100k个节点和1000万条边(每个节点100条边),最短路径算法在0.4-3秒内运行
  • 对于200k个节点和4000万条边(每个节点200条边),它至少需要40秒或更长时间
  • 我的电脑显然不是用于大数据分析的,但我甚至不知道购买一台128GB内存的服务器和一堆处理器是否能在合理的时间内解决第二次测试。(你认为可以吗?)

    当然,对于100万个或更多的节点,neo4j将不再帮助我了。 我花了很多时间在网上寻找像Neo4J这样的Giraph的使用方法:使用某种API(甚至是java),通过它我可以运行查询并输出结果。但是什么也没有


    提前感谢

    提出几个问题,以便我们更好地理解上下文。(1) 你是在做:(a)每对节点之间的最短路径,还是(b)两个特定节点之间的最短路径?(2) 如果是后者,您是否为数据编制了索引,以便快速找到2个特定节点(或者,您是否使用类似
    START n=node(123)
    的方法来识别特定节点)?2个节点之间的最短路径。我使用索引:)您能为您的问题添加更多信息吗?像你的图形模型,你运行的代码来计算最短路径等?你是否将你的最短路径限制为最大跳数4或10?你使用哪一版本的Neo4j?