我可以使用RDF/SPARQL查询从研究论文中检索信息吗?

我可以使用RDF/SPARQL查询从研究论文中检索信息吗?,sparql,rdf,Sparql,Rdf,我有RDF的基本知识,因此我不知道这是否可行。我正在研究使用元分析的研究论文。在的帮助下,我希望运行SPARQL查询,以检索有关元分析的相关信息。我希望我可以使用RDF/SPARQL来减少查找和组织相关信息的时间 现在,我的问题是: 我假设我需要先编写类似的东西,然后对其运行SPARQL查询,以检索/显示相关信息(当然,此RDF代码与元分析无关,但我想展示一个使用PROV本体的示例)。每一篇研究论文的RDF代码都会略有不同。因为我想回答相同的问题,主语和谓语将保持不变,但每次的值都会不同。理想情

我有RDF的基本知识,因此我不知道这是否可行。我正在研究使用元分析的研究论文。在的帮助下,我希望运行SPARQL查询,以检索有关元分析的相关信息。我希望我可以使用RDF/SPARQL来减少查找和组织相关信息的时间

现在,我的问题是:

我假设我需要先编写类似的东西,然后对其运行SPARQL查询,以检索/显示相关信息(当然,此RDF代码与元分析无关,但我想展示一个使用PROV本体的示例)。每一篇研究论文的RDF代码都会略有不同。因为我想回答相同的问题,主语和谓语将保持不变,但每次的值都会不同。理想情况下,我想制作一个“全局”RDF代码,它可以轻松地应用于每个元分析,因此不必手动填写RDF三元组的值部分(因为每个研究论文的值部分都不同,我希望三元组的值部分会根据研究论文的不同而自动改变)。
有没有一种方法可以让计算机自己在pdf文件/网站(研究发现的地方)中检索相关值,然后将其存储在RDF中,这样我就不必自己查找该值并将其放入RDF代码中

你想要什么“留空”?我不明白。我唯一了解的是,您希望为一些研究论文生成RDF数据,以便以后可以使用SPARQL查询数据。@unformedUser抱歉,如果不清楚,我将编辑我的原始帖子。我的意思是我自己填写RDF的主语和谓语,而不是值。然后我想知道计算机是否有可能(可能是通过机器学习?数据挖掘?)在pdf/网站本身中找到值,以便计算机填充RDF三元组的值部分。值是多少?我是说,你有一个PDF文件。你是说PDF文档的可选元数据吗?如果是,哪些元数据?如果没有,还有什么?元数据基本上是XML,所以如果你知道哪些字段,你可以提取出来。这听起来不像是RDf的问题。正如@UninformedUser所指出的:您所问的问题是如何从论文的某个部分提取值。然后将其作为对象放入RDF三元组的事实是次要的。你可以把值放在任何东西上。从文本中提取文本部分的最简单方法是使用简单的模式匹配-正则表达式等。如果源文本只是“文本”,则更高级的技术使用自然语言处理。如果源是表之类的东西,则需要使用文档元素度量技术(我希望的值始终与节标题等保持一定距离)。不完全是新手。你想“留空”什么?我不明白。我唯一了解的是,您希望为一些研究论文生成RDF数据,以便以后可以使用SPARQL查询数据。@unformedUser抱歉,如果不清楚,我将编辑我的原始帖子。我的意思是我自己填写RDF的主语和谓语,而不是值。然后我想知道计算机是否有可能(可能是通过机器学习?数据挖掘?)在pdf/网站本身中找到值,以便计算机填充RDF三元组的值部分。值是多少?我是说,你有一个PDF文件。你是说PDF文档的可选元数据吗?如果是,哪些元数据?如果没有,还有什么?元数据基本上是XML,所以如果你知道哪些字段,你可以提取出来。这听起来不像是RDf的问题。正如@UninformedUser所指出的:您所问的问题是如何从论文的某个部分提取值。然后将其作为对象放入RDF三元组的事实是次要的。你可以把值放在任何东西上。从文本中提取文本部分的最简单方法是使用简单的模式匹配-正则表达式等。如果源文本只是“文本”,则更高级的技术使用自然语言处理。如果源是表之类的东西,则需要使用文档元素度量技术(我希望的值始终与节标题等保持一定距离)。不完全是新手。