Machine learning 远程监控:如何将命名实体连接到freebase(KB)关系

Machine learning 远程监控:如何将命名实体连接到freebase(KB)关系,machine-learning,stanford-nlp,freebase,Machine Learning,Stanford Nlp,Freebase,我正在尝试创建一个远程监控语料库。到目前为止,我已经组装了数据,并将其通过一个NER系统传递,因此您可以看到下面的示例 原始数据: <p> Myles Brand, the president of the National Collegiate Athletic Association, said in a telephone interview that he had not been approached about whether the N.C.A.A. might ove

我正在尝试创建一个远程监控语料库。到目前为止,我已经组装了数据,并将其通过一个NER系统传递,因此您可以看到下面的示例

原始数据:

<p>
Myles Brand, the president of the National Collegiate Athletic Association, said in a telephone interview that he had not been approached about whether the N.C.A.A. might oversee a panel for the major bowl games similar to the one that chooses teams for the men's and women's basketball tournaments.
</p>
此外,我有数千个实体对,我想我可以使用Freebase java API编写一些简短的java程序,从而找出所有这些的关系,有没有人有这样一个程序的示例可以让我看一下


但我真正想知道的是,一旦我有了这些关系,用远程监控语料库来关联这些关系的最佳方式是什么,我很困惑,当它们最终组合在一起时,它们是什么样子的

你在自由基方面遇到了一些问题。首先,迈尔斯品牌和NCAA之间的关系不是直接的,而是由一个代表其职业的节点来调节的。此节点具有指向雇主、雇员、他们的头衔、开始日期和结束日期的链接。其次,反射查询比标准MQL查询具有更强的方向性,在本例中,Myles Brand是目标,而不是源

此查询将向您显示指向
/business/employment\u终身职位
节点的链接:

[{
  "type": "/type/link",
  "source": {
    "id": null
  },
  "master_property": null,
  "target": {
    "id": "/en/myles_brand"
  }
}]
但它需要扩展以处理您试图找到的多跳关系(以及提取标题)

如果你有足够小的一组你感兴趣的关系,你可以直接测试它们,而不是使用反射

例如,您可以使用以下方法测试雇佣关系(并获取头衔,如果有的话):

[{ 
 "type" : "/type/link", 
 "source" : { "id" : "/en/myles_brand" }, 
 "master_property" : null, 
 "target" : { "id" : "/en/national_collegiate_athletic_association" }, 
 "target_value" : null 
}]
[{
  "type": "/type/link",
  "source": {
    "id": null
  },
  "master_property": null,
  "target": {
    "id": "/en/myles_brand"
  }
}]
[{  
 "/business/employment_tenure/person" : { "id" : "/en/myles_brand" }, 
 "/business/employment_tenure/company" : { "id" : "/en/national_collegiate_athletic_association" }, 
 "/business/employment_tenture/title": null
}]