sparql查询在特定服务器上使用order by时变慢

sparql查询在特定服务器上使用order by时变慢,sparql,hadoop2,apache-marmotta,Sparql,Hadoop2,Apache Marmotta,我有一个简单的sparql查询。同样的查询在本地系统上运行得更快,而在后台服务器上则需要20秒。如果我从查询中删除orderby,两台服务器上都需要2秒钟。两台服务器上的记录计数相同;大约1,50000 PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> SELECT * WHERE { ?in

我有一个简单的sparql查询。同样的查询在本地系统上运行得更快,而在后台服务器上则需要20秒。如果我从查询中删除
orderby
,两台服务器上都需要2秒钟。两台服务器上的记录计数相同;大约1,50000

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
SELECT * WHERE
{
     ?instance rdf:type  <http://example.com/vocab/Sample>.
     ?instance rdfs:label ?label
}ORDER BY ?label OFFSET 0 LIMIT 20
前缀rdfs:
前缀rdf:
选择*WHERE
{
?实例rdf:类型。
?实例rdfs:标签?标签
}订购人?标签偏移量0限制20
我拥有的设置有:Hadoop、土拨鼠、动物园管理员、Redis、tomcat


感谢您提供帮助,找出根本原因。

现在的问题是什么?显然,
排序,即排序是一项昂贵的操作,通过Hadoop,数据分发时可能会更加复杂。我不知道你现在想听到什么,尤其是因为我没有提到你的本地机器和服务器之间的任何差异。没有人知道这两种设置有什么不同顺便问一下,不使用更常见的单节点三重存储的原因是什么?特别是因为数据很小…问题出在tomcat上。。重新启动tomcat之后,查询性能现在更好了。GC一定有问题。我必须调整那15万(15万)张唱片?或者150万(1500000)?在这里似乎不重要,但可靠的信息是有用帮助的关键…