OData与语义Web/链接数据的比较

OData与语义Web/链接数据的比较,odata,rdf,semantic-web,linked-data,Odata,Rdf,Semantic Web,Linked Data,我试图了解两种截然不同的数据共享方法:OData和语义Web/链接数据。这两者有很好的比较吗 据我所知,OData结合了联合/CRUD(AtomPub)、序列化格式(XML、JSON)、数据模型、查询语言和一些语义/约定来管理这些现有技术的使用。它主要用于公开来自一个系统的数据,以便其他系统可以使用它 链接数据是一种数据模型,是对URI的严格承诺,是一种(可选的?)序列化格式(RDF/XML),但(如果我错了,请纠正我)并没有说明任何有关传输、CRUD等的内容。它似乎旨在允许对从各种来源提取的大

我试图了解两种截然不同的数据共享方法:OData和语义Web/链接数据。这两者有很好的比较吗

据我所知,OData结合了联合/CRUD(AtomPub)、序列化格式(XML、JSON)、数据模型、查询语言和一些语义/约定来管理这些现有技术的使用。它主要用于公开来自一个系统的数据,以便其他系统可以使用它

链接数据是一种数据模型,是对URI的严格承诺,是一种(可选的?)序列化格式(RDF/XML),但(如果我错了,请纠正我)并没有说明任何有关传输、CRUD等的内容。它似乎旨在允许对从各种来源提取的大量小数据块进行推断。(目前对我们来说并不重要——我们将在少量数据源之间同步大量数据,并希望保留出处信息)

我对在某些数据管理平台之间共享数据的技术感兴趣,其中一些是我直接研究的。OData看起来更吸引人,因为它向开发人员解释起来非常简单:实现这个API,遵循Atom标准,像这样序列化数据。我们已经在一个平台上做了类似的事情:在Atom提要上共享XML序列化数据,使用URL参数进行过滤

相比之下,我过去使用RDF的经验给我的印象是脆弱、不透明(大量的RDF/XML)、不可访问(使用SPARQL vs SQL)技术——但也许我把使用像Jena这样的triplestore的经验与通过链接数据API公开现有数据库的经验混淆了


任何关于这两种方法在范围、技术、易用性、未来潜力等方面的差异和相似性的建议、评论等都将非常有用。

我认为深入讨论这一点并不是Stackoverflow的真正目的,但为了给你一些关于差异和重叠的有趣讨论的指针:

关键区别之一似乎是OData无法将来自不同来源的数据相互链接。基本上,你仍然被困在一个筒仓里


查看在这两种方法之间转换数据的各种尝试可能也很有趣。见a.o.

OData可能更容易,但无论如何也不是更好。SPARQL和RDF(忘掉RDF/XML,最好看看Turtle)满足了OData中的所有要求,并提供了许多更先进的功能,例如:

  • 联盟扩展
  • 链接数据
  • 推理和推理(为了更勇敢的人)

同样,支持这些标准的软件实际上相当复杂。大多数对OData感兴趣的人通常来自微软背景,因此请看一下比较矩阵:


不幸的是,表格格式非常糟糕,但内容很有用。

Steve-不确定这是解决此类问题的最佳论坛,因为它可能会拖一段时间。不过,我很想讨论一下——你是否可以把这个问题转移到我的新博客(bitwhys.com)上,或者从我的新博客(bitwhys.com)上联系到我?只是简单地谈谈你关于RDF/链接数据技术的一些观点:“大量的RDF/XML”不是标准,听起来更像是不正确的技术应用。我想,将SPARQL(与SQL相反)称为“不可访问”是一个品味问题。但应用链接数据原则并不需要SPARQL。只是方便而已。截至2015年2月,链接数据平台是W3C推荐的:LDP解决了链接数据中丢失的读写部分(您的问题中的CRUD)。感谢这些链接——尽管imho“您仍然被困在一个筒仓中”夸大了imho。(见MS在这里明确指出筒仓破坏是一个目标:)@SteveBennett当然,他们所说的目标和他们实际提供的并不一定相同。上面提到的一些文章更详细地探讨了这一点。然而,我不是OData专家,所以我可能忽略了链接数据的标准化机制。我不认为“信息筒仓”是“无法外部链接的信息”的同义词。如果你能以标准的格式和标准的语义很容易地从系统中获取信息,那么筒仓化的大部分问题就会消失,我想。啊,我明白了。嗯,这取决于你的目标,但我认为这些东西是同义词,或者至少是密切相关的。如果您无法将您的数据与其他任何人的数据关联起来(甚至说“这里的数据与那边的数据相同”),那么来自异构源的数据交换和集成将如何工作?这就是走出思洛存储器的意义:使您的数据在其他环境中可重用。如果没有这个,您只创建了一个稍微大一点的筒仓。YMMV:对于许多用例来说,稍微大一点的思洛存储器就足够了,当然:)没错——在我的上下文中,稍微大一点的思洛存储器就足够了。集成2到3个不同的信息源将是对我们目前的巨大改进。但对于一项依赖于网络效应的技术来说,更简单可能意味着更好,对吗?在这一领域,一项高技术的低利用率没有多大价值。@Steve Bennet,鉴于Facebook、谷歌、美国和英国政府(仅举几家公司的名字)在线生产基于RDF的链接数据,似乎没有理由称这项技术为“低利用率”。吉恩说得再好不过了