Machine learning 远程监控:如何将命名实体连接到freebase(KB)关系
我正在尝试创建一个远程监控语料库。到目前为止,我已经组装了数据,并将其通过一个NER系统传递,因此您可以看到下面的示例 原始数据:Machine learning 远程监控:如何将命名实体连接到freebase(KB)关系,machine-learning,stanford-nlp,freebase,Machine Learning,Stanford Nlp,Freebase,我正在尝试创建一个远程监控语料库。到目前为止,我已经组装了数据,并将其通过一个NER系统传递,因此您可以看到下面的示例 原始数据: <p> Myles Brand, the president of the National Collegiate Athletic Association, said in a telephone interview that he had not been approached about whether the N.C.A.A. might ove
<p>
Myles Brand, the president of the National Collegiate Athletic Association, said in a telephone interview that he had not been approached about whether the N.C.A.A. might oversee a panel for the major bowl games similar to the one that chooses teams for the men's and women's basketball tournaments.
</p>
此外,我有数千个实体对,我想我可以使用Freebase java API编写一些简短的java程序,从而找出所有这些的关系,有没有人有这样一个程序的示例可以让我看一下
但我真正想知道的是,一旦我有了这些关系,用远程监控语料库来关联这些关系的最佳方式是什么,我很困惑,当它们最终组合在一起时,它们是什么样子的 你在自由基方面遇到了一些问题。首先,迈尔斯品牌和NCAA之间的关系不是直接的,而是由一个代表其职业的节点来调节的。此节点具有指向雇主、雇员、他们的头衔、开始日期和结束日期的链接。其次,反射查询比标准MQL查询具有更强的方向性,在本例中,Myles Brand是目标,而不是源 此查询将向您显示指向
/business/employment\u终身职位
节点的链接:
[{
"type": "/type/link",
"source": {
"id": null
},
"master_property": null,
"target": {
"id": "/en/myles_brand"
}
}]
但它需要扩展以处理您试图找到的多跳关系(以及提取标题)
如果你有足够小的一组你感兴趣的关系,你可以直接测试它们,而不是使用反射
例如,您可以使用以下方法测试雇佣关系(并获取头衔,如果有的话):
[{
"type" : "/type/link",
"source" : { "id" : "/en/myles_brand" },
"master_property" : null,
"target" : { "id" : "/en/national_collegiate_athletic_association" },
"target_value" : null
}]
[{
"type": "/type/link",
"source": {
"id": null
},
"master_property": null,
"target": {
"id": "/en/myles_brand"
}
}]
[{
"/business/employment_tenure/person" : { "id" : "/en/myles_brand" },
"/business/employment_tenure/company" : { "id" : "/en/national_collegiate_athletic_association" },
"/business/employment_tenture/title": null
}]