使用JAVA异步运行gremlin查询时出现OOM错误

使用JAVA异步运行gremlin查询时出现OOM错误,java,out-of-memory,gremlin,janusgraph,tinkerpop3,Java,Out Of Memory,Gremlin,Janusgraph,Tinkerpop3,我们已经创建了一个restapi,它在Janus图上执行gremlin查询,并以JSON格式返回结果。API可用于小结果集的文件。但是对于大型结果集,当我们异步命中API时,它会给出以下错误,(max heap size-Xmx4g java.lang.OutOfMemoryError:超出GC开销限制 我正在使用curl和&异步命中API curl --location --request GET 'http://HOST:PORT/graph/search?gremlin=query &am

我们已经创建了一个restapi,它在Janus图上执行gremlin查询,并以JSON格式返回结果。API可用于小结果集的文件。但是对于大型结果集,当我们异步命中API时,它会给出以下错误,(max heap size
-Xmx4g

java.lang.OutOfMemoryError:超出GC开销限制

我正在使用curl和
&
异步命中API

curl --location --request GET 'http://HOST:PORT/graph/search?gremlin=query &
curl --location --request GET 'http://HOST:PORT/graph/search?gremlin=query &
curl --location --request GET 'http://HOST:PORT/graph/search?gremlin=query &
curl --location --request GET 'http://HOST:PORT/graph/search?gremlin=query &
连接到janus graph的代码

cluster = Cluster.open(config);
connect = cluster.connect();

submit = connect.submit(gremlin);
Iterator<Result> resultIterator = submit.iterator();
int count=0;
while (resultIterator.hasNext()){
    //add to list, commented to check OOM error
}
小精灵司机

org.apache.tinkerpop.gremlin-driver:3.4.6
如何像光标一样处理大型结果集,以便不是所有数据都加载到内存中?
是否有我缺少的配置?非常感谢您的帮助

小精灵查询:

g.withSack(0).V().hasLabel(%27material%27).has(%27dim_batchid%27,withinemit().repeat(sack(sum).by(constant(1)).inE().outV()).project(%27level%27,%27properties%27).by(sack()).by(tree().by(valueMap().by(fold().unfold())).by(valueMap().by(fold())))
从分析中,很明显是gremlin驱动程序导致了这个问题,但我不确定如何修复它并释放内存。

此外,线程进入冻结状态超过5分钟


我认为您可能遇到了这个问题。基本上,保存传入结果的队列的填充速度比您使用结果的速度快,并且您的堆被破坏了。您可以看到,在这个问题中有一个补丁似乎解决了问题,但我不相信这是最好的解决方案et,因此它尚未实施。如果您对如何解决问题有任何建议,请随时对问题进行评论。如果这不是您面临的问题,我认为您必须提供一种方法来复制您的问题或进行一些分析,以进一步隔离您的问题。也许按照您的意愿进行一些分析会很好我可以用这种方式证明TINKERPOP-2424是您的问题。如果您看了那篇文章中的,您应该会看到验证问题所采取的方法。

Gremlin服务器是否生成OOM或您的REST API?此外,它看起来像您提交了一个Gremlin脚本-您可能需要共享该查询。REST API在命中时导致OOMAPI是异步的。问题在这里
while(resultIterator.hasNext())
。查询返回一个大数据集,导致它等待所有结果完成。@stephenmallette我已在问题中添加了查询。该循环中的注释为“//add to list,commented to check error”-你真的在用每个结果构建一个
列表
对象吗?我在构建,但注释了该代码,以检查添加到列表是否导致OOM,但事实并非如此。感谢你的回答。我已经完成了分析,似乎问题出在gremlin驱动程序上。我已经添加了分析的屏幕截图。我认为这与QE无关在我的测试中,我发现仅仅在没有处理结果的情况下进行迭代并没有足够快地清空队列以使GC跟上。这有点奇怪-直到我亲眼看到才相信这一点。只有在异步运行查询时才出现问题它适用于单个查询执行。但即使对于单个查询,它也不会释放所有堆内存。
g.withSack(0).V().hasLabel(%27material%27).has(%27dim_batchid%27,withinemit().repeat(sack(sum).by(constant(1)).inE().outV()).project(%27level%27,%27properties%27).by(sack()).by(tree().by(valueMap().by(fold().unfold())).by(valueMap().by(fold())))