我可以使用RDF/SPARQL查询从研究论文中检索信息吗？_Sparql_Rdf

我可以使用RDF/SPARQL查询从研究论文中检索信息吗？

sparql rdf

我可以使用RDF/SPARQL查询从研究论文中检索信息吗？,sparql,rdf,Sparql,Rdf,我有RDF的基本知识，因此我不知道这是否可行。我正在研究使用元分析的研究论文。在的帮助下，我希望运行SPARQL查询，以检索有关元分析的相关信息。我希望我可以使用RDF/SPARQL来减少查找和组织相关信息的时间现在，我的问题是：我假设我需要先编写类似的东西，然后对其运行SPARQL查询，以检索/显示相关信息（当然，此RDF代码与元分析无关，但我想展示一个使用PROV本体的示例）。每一篇研究论文的RDF代码都会略有不同。因为我想回答相同的问题，主语和谓语将保持不变，但每次的值都会不同。理想情

我有RDF的基本知识，因此我不知道这是否可行。我正在研究使用元分析的研究论文。在的帮助下，我希望运行SPARQL查询，以检索有关元分析的相关信息。我希望我可以使用RDF/SPARQL来减少查找和组织相关信息的时间

现在，我的问题是：

我假设我需要先编写类似的东西，然后对其运行SPARQL查询，以检索/显示相关信息（当然，此RDF代码与元分析无关，但我想展示一个使用PROV本体的示例）。每一篇研究论文的RDF代码都会略有不同。因为我想回答相同的问题，主语和谓语将保持不变，但每次的值都会不同。理想情况下，我想制作一个“全局”RDF代码，它可以轻松地应用于每个元分析，因此不必手动填写RDF三元组的值部分（因为每个研究论文的值部分都不同，我希望三元组的值部分会根据研究论文的不同而自动改变）。

有没有一种方法可以让计算机自己在pdf文件/网站（研究发现的地方）中检索相关值，然后将其存储在RDF中，这样我就不必自己查找该值并将其放入RDF代码中

你想要什么“留空”？我不明白。我唯一了解的是，您希望为一些研究论文生成RDF数据，以便以后可以使用SPARQL查询数据。@unformedUser抱歉，如果不清楚，我将编辑我的原始帖子。我的意思是我自己填写RDF的主语和谓语，而不是值。然后我想知道计算机是否有可能（可能是通过机器学习？数据挖掘？）在pdf/网站本身中找到值，以便计算机填充RDF三元组的值部分。值是多少？我是说，你有一个PDF文件。你是说PDF文档的可选元数据吗？如果是，哪些元数据？如果没有，还有什么？元数据基本上是XML，所以如果你知道哪些字段，你可以提取出来。这听起来不像是RDf的问题。正如@UninformedUser所指出的：您所问的问题是如何从论文的某个部分提取值。然后将其作为对象放入RDF三元组的事实是次要的。你可以把值放在任何东西上。从文本中提取文本部分的最简单方法是使用简单的模式匹配-正则表达式等。如果源文本只是“文本”，则更高级的技术使用自然语言处理。如果源是表之类的东西，则需要使用文档元素度量技术（我希望的值始终与节标题等保持一定距离）。不完全是新手。你想“留空”什么？我不明白。我唯一了解的是，您希望为一些研究论文生成RDF数据，以便以后可以使用SPARQL查询数据。@unformedUser抱歉，如果不清楚，我将编辑我的原始帖子。我的意思是我自己填写RDF的主语和谓语，而不是值。然后我想知道计算机是否有可能（可能是通过机器学习？数据挖掘？）在pdf/网站本身中找到值，以便计算机填充RDF三元组的值部分。值是多少？我是说，你有一个PDF文件。你是说PDF文档的可选元数据吗？如果是，哪些元数据？如果没有，还有什么？元数据基本上是XML，所以如果你知道哪些字段，你可以提取出来。这听起来不像是RDf的问题。正如@UninformedUser所指出的：您所问的问题是如何从论文的某个部分提取值。然后将其作为对象放入RDF三元组的事实是次要的。你可以把值放在任何东西上。从文本中提取文本部分的最简单方法是使用简单的模式匹配-正则表达式等。如果源文本只是“文本”，则更高级的技术使用自然语言处理。如果源是表之类的东西，则需要使用文档元素度量技术（我希望的值始终与节标题等保持一定距离）。不完全是新手。