sparql查询在特定服务器上使用order by时变慢_Sparql_Hadoop2_Apache Marmotta

sparql查询在特定服务器上使用order by时变慢

sparql

sparql查询在特定服务器上使用order by时变慢,sparql,hadoop2,apache-marmotta,Sparql,Hadoop2,Apache Marmotta,我有一个简单的sparql查询。同样的查询在本地系统上运行得更快，而在后台服务器上则需要20秒。如果我从查询中删除orderby，两台服务器上都需要2秒钟。两台服务器上的记录计数相同；大约1,50000 PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> SELECT * WHERE { ?in

我有一个简单的sparql查询。同样的查询在本地系统上运行得更快，而在后台服务器上则需要20秒。如果我从查询中删除

orderby

，两台服务器上都需要2秒钟。两台服务器上的记录计数相同；大约1,50000

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
SELECT * WHERE
{
     ?instance rdf:type  <http://example.com/vocab/Sample>.
     ?instance rdfs:label ?label
}ORDER BY ?label OFFSET 0 LIMIT 20

前缀rdfs:
前缀rdf：
选择*WHERE
{
？实例rdf：类型。
？实例rdfs:标签？标签
}订购人？标签偏移量0限制20

我拥有的设置有：Hadoop、土拨鼠、动物园管理员、Redis、tomcat

感谢您提供帮助，找出根本原因。

现在的问题是什么？显然，

按

排序，即排序是一项昂贵的操作，通过Hadoop，数据分发时可能会更加复杂。我不知道你现在想听到什么，尤其是因为我没有提到你的本地机器和服务器之间的任何差异。没有人知道这两种设置有什么不同顺便问一下，不使用更常见的单节点三重存储的原因是什么？特别是因为数据很小…问题出在tomcat上。。重新启动tomcat之后，查询性能现在更好了。GC一定有问题。我必须调整那15万（15万）张唱片？或者150万（1500000）？在这里似乎不重要，但可靠的信息是有用帮助的关键…