Java Jena TDB/Fuseki性能
我有一个简单的SPARQL查询,它使用本地Fuseki SPARQL端点在我的Jena TDB存储上执行得相当快:Java Jena TDB/Fuseki性能,java,sparql,jena,tdb,fuseki,Java,Sparql,Jena,Tdb,Fuseki,我有一个简单的SPARQL查询,它使用本地Fuseki SPARQL端点在我的Jena TDB存储上执行得相当快: SELECT DISTINCT ?p WHERE { ?s rdf:type dbpedia-owl:Organisation . ?s ?p dbpedia:California . } LIMIT 10 它可能需要10秒钟才能完成,并包含一些owl:ObjectProperty和其他属性。当我想使用以下查询仅显示对象属性时,请注意附加的三元组和末尾的1限制: SE
SELECT DISTINCT ?p
WHERE
{
?s rdf:type dbpedia-owl:Organisation .
?s ?p dbpedia:California .
}
LIMIT 10
它可能需要10秒钟才能完成,并包含一些owl:ObjectProperty和其他属性。当我想使用以下查询仅显示对象属性时,请注意附加的三元组和末尾的1限制:
SELECT DISTINCT ?p
WHERE
{
?s rdf:type dbpedia-owl:Organisation .
?s ?p dbpedia:California .
?p a owl:ObjectProperty .
}
LIMIT 1
然后,我希望答案同样快速地出现,并且只显示前面显示的一个对象属性。毕竟,这只是对前一个查询的进一步细化。但是,查询时间要长很多倍,并且在几分钟而不是几秒钟后完成
我在这里感到困惑。为什么第二个查询需要这么长时间
我使用的是Fuseki版本1.1.0。这是我的fuseki配置文件:
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix tdb: <http://jena.hpl.hp.com/2008/tdb#> .
@prefix ja: <http://jena.hpl.hp.com/2005/11/Assembler#> .
@prefix text: <http://jena.apache.org/text#> .
@prefix fuseki: <http://jena.apache.org/fuseki#> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix : <http://localhost/dbpedia37#> .
[] rdf:type fuseki:Server ;
fuseki:services (
:service_text_tdb
) .
## Example of a TDB dataset and text index
## Initialize TDB
[] ja:loadClass "com.hp.hpl.jena.tdb.TDB" .
tdb:DatasetTDB rdfs:subClassOf ja:RDFDataset .
tdb:GraphTDB rdfs:subClassOf ja:Model .
## Initialize text query
[] ja:loadClass "org.apache.jena.query.text.TextQuery" .
# A TextDataset is a regular dataset with a text index.
text:TextDataset rdfs:subClassOf ja:RDFDataset .
# Lucene index
text:TextIndexLucene rdfs:subClassOf text:TextIndex .
## ---------------------------------------------------------------
## This URI must be fixed - it's used to assemble the text dataset.
:text_dataset rdf:type text:TextDataset ;
text:dataset :dataset ;
text:index :indexLucene ;
.
# A TDB datset used for RDF storage
:dataset rdf:type tdb:DatasetTDB ;
tdb:location "/Users/jsimon/No-Backup/dbpedia37/tdb" ;
# tdb:unionDefaultGraph true ; # Optional
.
# Text index description
:indexLucene a text:TextIndexLucene ;
text:directory <file:Lucene> ;
##text:directory "mem" ;
text:entityMap :entMap ;
.
# Mapping in the index
# URI stored in field "uri"
# rdfs:label is mapped to field "text"
:entMap a text:EntityMap ;
text:entityField "uri" ;
text:defaultField "text" ;
text:map (
[ text:field "text" ; text:predicate rdfs:label ]
[ text:field "text" ; text:predicate foaf:name ]
) .
:service_text_tdb rdf:type fuseki:Service ;
rdfs:label "TDB/text service" ;
fuseki:name "ds" ;
fuseki:serviceQuery "query" ;
fuseki:serviceQuery "sparql" ;
fuseki:serviceUpdate "update" ;
fuseki:serviceUpload "upload" ;
fuseki:serviceReadGraphStore "get" ;
fuseki:serviceReadWriteGraphStore "data" ;
fuseki:dataset :text_dataset ;
.
它会反复花费那么长的时间吗?例如,如果在同一会话中多次运行查询?我不知道是否会有一个预热期或类似的时间。由于您在第二个查询中只选择了一个,如果删除distinct会发生什么情况?不幸的是,这需要同样长的时间。当我移除对象属性约束并增加限制时,结果几乎是即时存在的,并且它确实包含对象属性。这是Fuseki的哪个版本?配置是什么?但它比普通数据集更复杂。请尝试最新的开发版本(这里有一个可能的问题已修复),或者删除文本索引以测试同一查询,看看这是否有帮助。此外,减少不明显可能是有用的信息。