使用RDFLib从网页中提取非RDF数据作为RDF数据_Rdf_Virtuoso_Rdflib_N Triples

使用RDFLib从网页中提取非RDF数据作为RDF数据

rdf

使用RDFLib从网页中提取非RDF数据作为RDF数据,rdf,virtuoso,rdflib,n-triples,Rdf,Virtuoso,Rdflib,N Triples,我最近安装了RDFLib来处理RDF数据。我想从任何带有非RDF/RDF数据的网页中提取RDF数据，比如Virtuoso Sponger [就像这个链接一样]（）并存储为N-Triples（nt）或N3/Turtle格式（如链接页脚中的选项）。如果执行，我会收到警告和错误 g.parse("http://www.slideshare.net/kleinerperkins/internet-trends-v1.html",format="n3") g.parse("http://www.sl

我最近安装了RDFLib来处理RDF数据。我想从任何带有非RDF/RDF数据的网页中提取RDF数据，比如Virtuoso Sponger

[就像这个链接一样]（）

并存储为N-Triples（nt）或N3/Turtle格式（如链接页脚中的选项）。如果执行，我会收到警告和错误

 g.parse("http://www.slideshare.net/kleinerperkins/internet-trends-v1.html",format="n3")

g.parse("http://www.slideshare.net/kleinerperkins/internet-trends-v1.html",format="n3")

还有一个内置的功能，用于使用RDFLib进行本体映射吗

如果执行，我会收到警告和错误

 g.parse("http://www.slideshare.net/kleinerperkins/internet-trends-v1.html",format="n3")

g.parse("http://www.slideshare.net/kleinerperkins/internet-trends-v1.html",format="n3")

这并不奇怪，因为您实际上要求它使用n3解析器解析HTML页面

你可以跑

g.parse("http://www.slideshare.net/kleinerperkins/internet-trends-v1.html", format="html")

但这可能也不是你想要的。RDFLib可以与嵌入在HTML中的RDF（如RDFa或microdata）一起工作，它还可以从HTML中提取一些“通用RDF”，但结果与您从uriburner获得的结果截然不同。原因是它使用了一个定制的“slideshare”大师赞助者，专门为其定制，以从slideshare HTML中提取更多有用的信息。如果您想使用专门发起人提供的知识，您可以通过解析uriburner的RDF版本来“通过”uriburner查询页面（链接可在页面底部找到）：

你能用“本体映射的功能”来完善你的意思吗？太好了，谢谢@Hees。你知道我的第二个问题吗，关于本体论？正如在你问题的评论中提到的，我不清楚你在搜索什么功能。RDFLib（顾名思义）主要是关于使用RDF的。@Hees我想我能够得到我想要的东西，多亏了你的g.parse行。1.你能解释一下你是如何形成这个链接的吗，比如在sparql部分之后，这个链接太长了，而最初的链接只是包含了kleinerperkins/internet-trends-v1.html。2.此外，如果我需要xml格式的数据，我尝试编写format='n3'，但出现了多个错误，因此，如果我需要xml格式（基本上是为了获取标记），我该怎么做？1。我从uriburner页面的底部复制粘贴的if（参见屏幕截图）2。好的，如果您需要xml，您显然需要指定

format='xml'

并从uriburner复制xml链接……好的，明白了，所以我不想在浏览器上打开页面并只获取数据，但在这种方法中，我必须手动转到页面底部以获取链接。是否有任何其他可能的解决方案可以在不手动访问页面的情况下获取链接（n3/xml）？