Machine learning 如何对提取的关系(NLP)进行分类?

Machine learning 如何对提取的关系(NLP)进行分类?,machine-learning,nlp,classification,stanford-nlp,text-mining,Machine Learning,Nlp,Classification,Stanford Nlp,Text Mining,有一些没有标注语料库。我从中提取了三元组(对象、关系、对象)。对于关系提取,我使用斯坦福OpenIE。但我只需要其中的一些三倍。例如,我需要关系“资金”” 文本: 每一家初创公司都需要稳定的资金来保持其强大和成长。Datadog是一种监控服务,帮助客户将来自各种基础设施和软件的数据汇集在一起,也不例外。今天,它宣布了一轮价值9450万美元的大规模D轮融资。公司不会讨论估值问题。 从本文中,我想提取关系(Datadog,宣布,每轮9450万美元) 我只有一个想法: 使用StanfordCorefe

有一些没有标注语料库。我从中提取了三元组(对象、关系、对象)。对于关系提取,我使用斯坦福OpenIE。但我只需要其中的一些三倍。例如,我需要关系“资金”

文本
每一家初创公司都需要稳定的资金来保持其强大和成长。Datadog是一种监控服务,帮助客户将来自各种基础设施和软件的数据汇集在一起,也不例外。今天,它宣布了一轮价值9450万美元的大规模D轮融资。公司不会讨论估值问题。

从本文中,我想提取关系
(Datadog,宣布,每轮9450万美元)

我只有一个想法:

  • 使用StanfordCoreference检测第一句中的“Datadog”和第二句中的“it”是同一实体
  • 尝试将关系聚集起来,但我认为这样做不会很好

  • 可能有更好的方法吗?可能我需要有标签的语料库(我没有)?

    如果你澄清你的问题,你可能会得到更多/更好的反馈。具体而言,关系
    资金
    与关系
    宣布
    一个想法
    与下表中的两个项目。“未标记”的常用术语是“无监督”。此外,集群关系也不会有帮助,因为“宣布”与“资助”无关,但它们宣布了一个“资助”事件,即你感兴趣的是对象,而不是谓词。无论您采取何种方法,在这里取得任何进展都需要共同参考决议。