将HTML转换为RDF

将HTML转换为RDF,html,rdf,semantic-web,ontology,Html,Rdf,Semantic Web,Ontology,我正在寻找一个通用的API/web服务/工具/等等。。。这允许将给定的HTML页面转换为尽可能具体的RDF图(最有可能使用back bone本体和/或映射器)。您证明了吗 GRDDL是一种获取RDF的技术 来自XML文档和中的数据 特定的XHTML页面 我使用XQuery从给定的一组网页中提取数据。我必须为网页编写自定义查询。我认为对于一组特定的HTML文件,这是最直接的方法。然而,这显然不利于一般情况。对于不同的网页集,需要编写其他自定义查询 我使用JSoup从HTML中提取数据。它使用jQu

我正在寻找一个通用的API/web服务/工具/等等。。。这允许将给定的HTML页面转换为尽可能具体的RDF图(最有可能使用back bone本体和/或映射器)。

您证明了吗

GRDDL是一种获取RDF的技术 来自XML文档和中的数据 特定的XHTML页面


我使用XQuery从给定的一组网页中提取数据。我必须为网页编写自定义查询。我认为对于一组特定的HTML文件,这是最直接的方法。然而,这显然不利于一般情况。对于不同的网页集,需要编写其他自定义查询

我使用JSoup从HTML中提取数据。它使用jQuery风格的查询HTMLDOM,我已经熟悉它了,所以它对我来说是一个非常简单的工具。我还为它提供了相当强大的资金,但我需要它只是为了刮取3个数据源,所以我还没有丰富的使用此工具的经验

您是否可以控制HTML文档的内容?或者它必须是任何随机文档?它可以是任何HTML文档。我需要将HTML文档的结构提取到RDF图中。如果转换使用主干映射器/本体,那就更好了。看起来XSPARQL可以通过根据本体编写的自定义查询实现这一点……所谓“HTML文档的结构”是指
div的结构
p的结构
等等?以这个SO页面为例:您想要的RDF输出是什么?