Python 3.x 使用Python RDFLib解释.ttl文件中链接数据的工作流

Python 3.x 使用Python RDFLib解释.ttl文件中链接数据的工作流,python-3.x,rdflib,turtle-rdf,Python 3.x,Rdflib,Turtle Rdf,我正在使用包含历史研究传记信息的海龟档案。这些文件由一家大型图书馆提供,文件中的大部分信息都不明确。例如,虽然人们的职业有时会与图书馆的URI链接一起列出,但我只在大多数情况下拥有URI。这就是为什么我需要在我的工作流程中的某个时刻检索它们背后的信息,我希望能得到一些建议 我想使用Python的RDFLib来解析.ttl文件。你推荐的工作流程是什么?我是否应该先阅读我感兴趣的前缀,然后将结果存储在.txt(?)中,然后编写一个脚本从web检索实际信息,替换URI 我还看到了将RDF直接转换为CS

我正在使用包含历史研究传记信息的海龟档案。这些文件由一家大型图书馆提供,文件中的大部分信息都不明确。例如,虽然人们的职业有时会与图书馆的URI链接一起列出,但我只在大多数情况下拥有URI。这就是为什么我需要在我的工作流程中的某个时刻检索它们背后的信息,我希望能得到一些建议

我想使用Python的RDFLib来解析.ttl文件。你推荐的工作流程是什么?我是否应该先阅读我感兴趣的前缀,然后将结果存储在.txt(?)中,然后编写一个脚本从web检索实际信息,替换URI

我还看到了将RDF直接转换为CSV的方法,但尽管CSV很好用,但只要转换所有数据,我就会得到很多不需要的“背景噪音”


您有什么建议?

RDFlib的全部内容都是关于使用RDF数据。如果您有RDF数据,我的建议是尽可能多地使用RDF本机内容,然后仅当您想打印表格结果或加载到数据帧中时才导出到CSV。当然,做事情的方法总是不止一种,所以你可以在CSV中操作数据,但是RDF,从设计上来说,比CSV文件有更多的信息,所以当你操作RDF数据时,你有更多的东西要掌握

文件中的大多数信息都不明确

更好的措辞:大多数信息是用URI标识的对象表示的,而不是作为文本值给出的

我想使用Python的RDFLib来解析.ttl文件。你推荐的工作流程是什么?我是否应该先阅读我感兴趣的前缀,然后将结果存储在.txt(?)中,然后编写一个脚本从web检索实际信息,替换URI

不!您应该存储您可以获取的ttl文件,然后您确实可以检索URI引用的所有其他数据,但是,据推测,该数据也是RDF格式的,因此您应该将其下载到加载初始ttl文件的同一个图形中,然后您可以拥有完整的图形,其中包含链接和文字值,您可以使用SPARQL查询处理该图形