Hash 散列分区RDF(OWL/N3/NT)数据集

Hash 散列分区RDF(OWL/N3/NT)数据集,hash,rdf,owl,nt,n3,Hash,Rdf,Owl,Nt,N3,我有一个包含三元组的N3数据集。我希望对这个数据集进行哈希分区。是否有哈希分区器对OWL/NT/N3数据集进行哈希分区?如果没有,请您提供一些代码/提示,说明如何以有效的方式继续解析文件。解析RDF文件与以有效的方式存储生成的三元组是完全不同的任务。为了简单地解析RDF文件,您可以使用许多RDF处理库中的一个,这很好。(StackOverflow实际上不是工具列表的地方,但上面的问题列出了一系列工具。)正如您在评论中所阐明的: 我使用LUBM(Lehigh University Benchmar

我有一个包含三元组的N3数据集。我希望对这个数据集进行哈希分区。是否有哈希分区器对OWL/NT/N3数据集进行哈希分区?如果没有,请您提供一些代码/提示,说明如何以有效的方式继续解析文件。

解析RDF文件与以有效的方式存储生成的三元组是完全不同的任务。为了简单地解析RDF文件,您可以使用许多RDF处理库中的一个,这很好。(StackOverflow实际上不是工具列表的地方,但上面的问题列出了一系列工具。)正如您在评论中所阐明的:

我使用LUBM(Lehigh University Benchmark)生成了一个OWL数据集 数据生成器,并使用联机 转换器。现在,我想对数据集和存储进行哈希分区 工作计算机上的每个分区。在实现我自己的之前,我 我想知道是否有这样的图书馆。你能帮我吗 给我指出一些可用的库。至于效率,我 提到它是因为我拥有的数据集非常大,并且使用 顺序散列分区器可能会花费大量时间来完成 任务

这里至少有两件重要的事情需要注意

  • OWL与RDF不同,但OWL可以在RDF中序列化。看起来您已经在RDF中序列化了OWL
  • RDF可以以多种形式序列化。其中最常见的是RDF/XML,但也有N3、Turtle(N3的子集)和N-Triples(NT)
  • N-Triples是一种基于行的格式,每行只有一个Triples。如果您只需要将数据分成三部分并发送到不同的位置,只需将其转换为N个三元组,其中k个三元组位于k行上。然后,您可以将第一个k/3发送给worker A,第二个k/3发送给worker B,最后一个k/3发送给worker B。或者,您可以一次遍历一行,将一行发送到A,然后将一行发送到B,然后将一行发送到C。这是N-Triples的一大优点:拆分或合并数据集非常便宜。作为一个例子,考虑这个dBPEDIAQuess和。你可以把它分成3行、3行和4行,然后把它们发给你的员工

    construct where { 
      dbpedia:Mount_Monadnock ?prop ?obj
    }
    limit 10 
    
    。
    .
    .
    .
    .
    .
    .
    .
    .
    .
    
    结束问题的原因包括“询问代码的问题必须证明对正在解决的问题的最低理解。包括尝试的解决方案、为什么不起作用以及预期的结果。”到目前为止,您尝试过什么样的事情?解析文件与高效地存储生成的三元组是完全不同的任务。至于“以有效的方式解析文件”,我通常使用许多RDF处理库中的一个,这很好。你能解释一下你到底在做什么吗?到目前为止还有什么没有用?谢谢你在这里解释协议。我使用LUBM(Lehigh University Benchmark)的数据生成器生成了一个OWL数据集,并使用在线转换器将其转换为N3格式。现在,我想对数据集进行散列分区,并将每个分区存储在工作机器上。在实现我自己的库之前,我想知道是否有这样一个库。你能给我指出一些可用的图书馆吗。至于效率,我提到它是因为我拥有的数据集非常大,使用顺序散列分区器可能会花费大量时间来完成任务。其次,RDF可以以多种形式序列化。其中最常见的是RDF/XML,但也有N3、Turtle(N3的子集)和N-Triples(NT)。N-Triples是一种基于行的格式。如果您只需要将数据分成三部分并发送到不同的位置,只需将其转换为N个三元组即可。它将有k行。将第一个k/3发送到A,第二个k/3发送到B,最后一个k/3发送到B。或者您可以一次遍历一行,将一行发送到A,然后将一行发送到B,然后将一行发送到C。N-Triples的一个最大优点是它是基于行的,因此拆分或组合数据集非常便宜。这就是你要找的东西吗?如果是的话,我可以把它写在一个答案中。@NewToAndroid关于哪些工具:有很多东西取决于品味、编程环境。一个简单的谷歌搜索应该给你足够的起点,或者看看这里的一些相关问题,比如
    <http://dbpedia.org/resource/Mount_Monadnock>   <http://www.w3.org/1999/02/22-rdf-syntax-ns#type>   <http://schema.org/Mountain> .
    <http://dbpedia.org/resource/Mount_Monadnock>   <http://www.w3.org/1999/02/22-rdf-syntax-ns#type>   <http://dbpedia.org/ontology/NaturalPlace> .
    <http://dbpedia.org/resource/Mount_Monadnock>   <http://www.w3.org/1999/02/22-rdf-syntax-ns#type>   <http://www.opengis.net/gml/_Feature> .
    <http://dbpedia.org/resource/Mount_Monadnock>   <http://www.w3.org/1999/02/22-rdf-syntax-ns#type>   <http://dbpedia.org/class/yago/GeologicalFormation109287968> .
    <http://dbpedia.org/resource/Mount_Monadnock>   <http://www.w3.org/1999/02/22-rdf-syntax-ns#type>   <http://umbel.org/umbel/rc/Mountain> .
    <http://dbpedia.org/resource/Mount_Monadnock>   <http://www.w3.org/1999/02/22-rdf-syntax-ns#type>   <http://dbpedia.org/ontology/Mountain> .
    <http://dbpedia.org/resource/Mount_Monadnock>   <http://www.w3.org/1999/02/22-rdf-syntax-ns#type>   <http://dbpedia.org/ontology/Place> .
    <http://dbpedia.org/resource/Mount_Monadnock>   <http://www.w3.org/1999/02/22-rdf-syntax-ns#type>   <http://dbpedia.org/class/yago/Object100002684> .
    <http://dbpedia.org/resource/Mount_Monadnock>   <http://www.w3.org/1999/02/22-rdf-syntax-ns#type>   <http://schema.org/Place> .
    <http://dbpedia.org/resource/Mount_Monadnock>   <http://www.w3.org/1999/02/22-rdf-syntax-ns#type>   <http://www.w3.org/2002/07/owl#Thing> .