Rdf 作者消歧

Rdf 作者消歧,rdf,author,disambiguation,Rdf,Author,Disambiguation,伙计们,我正在研究DBLP,并使用Hugh Glaser的存储库,RKB-EXPLORER DBLP(rdf/xml)。 考虑DBLP中的一篇文章: 如您所见,本文的作者id如下: 我在不同的文章中尝试了相同的作者姓名,并且知道上面的id详细信息如下: b3f641eef09c498bdd94087b74854be9:作者姓名的32个图表演员编码。(没关系) 36a6b8e7b69947e5659953aaf7fb802c:文章名的32编码 所以,它实际上给了“同名”的人相同的id,但许多人

伙计们,我正在研究DBLP,并使用Hugh Glaser的存储库,RKB-EXPLORER DBLP(rdf/xml)。 考虑DBLP中的一篇文章:

如您所见,本文的作者id如下:

我在不同的文章中尝试了相同的作者姓名,并且知道上面的id详细信息如下:

b3f641eef09c498bdd94087b74854be9:作者姓名的32个图表演员编码。(没关系) 36a6b8e7b69947e5659953aaf7fb802c:文章名的32编码

所以,它实际上给了“同名”的人相同的id,但许多人有完全相同的名字。这是歧义。 为了消除dblp作者的歧义,我尝试了以下两种方法:

  • 获取每篇文章的从属关系,然后如果相同的名称出现在具有相同从属关系的两篇文章中。我想这肯定是同一个人。 但困难在于dblp.rkbelporer.com数据集没有提供足够的信息。而使用谷歌搜索来搜索文章标题,也无法获得足够的信息
  • 获取每篇文章的所有作者的图片,并执行类似于“个人图片匹配”的操作,以检查同一姓名是否为同一个人。 但这也是某种不可行的,因为作者个人形象的文章太少了

  • 那么,有什么建议吗?非常感谢。

    我很难理解你的问题。你能举一个例子,两个不同的作者被同一个IRI识别吗?@JoshuaTaylor好的,我明白了。dblp rdf将数字序列后缀添加到同名作者。1.费武2。费武0002没关系。谢谢你,伙计。@JoshuaTaylor hi,另一个问题,为什么dblp.rkbexplorer中这么多论文作者没有组织或大学信息。正如你可以在这两个链接中看到的属性“有附属关系”:(无附属关系)(有附属麻省理工)@JoshuaTaylor,rdf数据集中的组织甚至不包含“普林斯顿”或“哈佛”许多著名大学。除了阅读此问题后浏览的内容外,我对该数据集了解不多,所以我不知道为什么有些作者有从属关系,而有些没有。我希望数据集只是DBLP数据的翻译(但我不确定这一点);DBLP是否包含RDF数据集不包含的从属关系?另外,如果你还有其他问题,最好单独提问,因为不是每个人都阅读评论,评论可以删除,等等。