Graph 使用自然语言处理(NLP)从文本(即非正式图形';模式';)推断图形数据库顶点/边-是否存在这种情况?

Graph 使用自然语言处理(NLP)从文本(即非正式图形';模式';)推断图形数据库顶点/边-是否存在这种情况?,graph,neo4j,nlp,titan,linguistics,Graph,Neo4j,Nlp,Titan,Linguistics,注意:我既不是语言学家,也不是图理论家,但是,我是一名[Java]开发人员,希望使用图数据库实现持久性,以下主题我感兴趣,我希望其他人也感兴趣 好的,我们的想法是使用一些应用程序或代码来: 识别给定文本中命名实体之间的嵌入关系结构 在图形数据库结构中应用或公开这些发现的关系 在这样一个系统中,文本基本上可以形成一个基本的、门外汉编写的各种图形模式。为了更好地体现这一点,这里有一些[非常]基本的文本: Andrew is married to Jane 使用,我得到以下信息: Andrew_NP

注意:我既不是语言学家,也不是图理论家,但是,我是一名[Java]开发人员,希望使用图数据库实现持久性,以下主题我感兴趣,我希望其他人也感兴趣

好的,我们的想法是使用一些应用程序或代码来:

  • 识别给定文本中命名实体之间的嵌入关系结构
  • 在图形数据库结构中应用或公开这些发现的关系
  • 在这样一个系统中,文本基本上可以形成一个基本的、门外汉编写的各种图形模式。为了更好地体现这一点,这里有一些[非常]基本的文本:

    Andrew is married to Jane
    
    使用,我得到以下信息:

    Andrew_NP0 is_VBZ married_AJ0 to_SENT Jane_NP0
    
    根据“@Oxford University,NP0='property noon',这是一个名称(如您所知),但这些NP0标记的条目将有助于成为graph vertice实例/节点(最终用户可能会被进一步提示为这些条目提供一个包含在内的“类型/描述”)。动词“VBZ”和形容词AJ0可能会突出显示图形关系

    一旦最终用户确认了他们的图形表示,他们可能会将其导出到,以便重新导入到图形数据库中,如或

    因此,总体想法是要有一个工具,让外行最终用户能够使用日常语言创建基于图论的数据库结构

    这样的工具是否已经存在

    我以上的一些观察结果在某种程度上受到以下工具(以及其他工具)的影响:


    是的,这存在于许多不同的地方。例子包括(路透社创建的)和。还有一系列其他的工具包和API,比如,它们并没有向您提供一个完整的解决方案,而是一系列构建定制解决方案所必需的工具

    这是一个非常深入的领域,有待继续研究。这里我不能涵盖所有内容,但有一点需要记住,这一领域中的解决方案通常非常特定于特定的文档“语料库”。能很好地处理任意英文文本的软件实际上并不存在。相反,您看到的是在商业新闻稿中做得非常好的解决方案。或者情报报告。或报纸文章。或医疗警报。但不是任意的文本

    这个地区也充满了很多问题;其中一个大的是被称为“”

    安德鲁和简结婚了。安德鲁昨天买了鸡蛋


    这里讨论了多少人?第二个和第一个一样吗?这是一个非常复杂的背景问题。但您最好把它弄对,否则结果图中的“person”节点可能会比您预期的多或少。

    谢谢您的快速回答。我知道NLTK和OpenCalais(我使用过在线查看器)。是的,您关于命名实体的观点非常有效,但是,我的“建议”解决方案可能会尝试让最终用户识别并关联提取的实体,以便跨子句跟踪它们(即,根据输入文本创建排序字典)。正如我所说,我不是一个专家,我只是觉得整个NLP的想法非常吸引人(再次感谢)。许多这样的方法已经建立起来——它们被归类为“半自动”文本提取。你可以搜索文献;不过,这是可重用的,这很值得怀疑,因为当你走上半自动化的路线时,你需要从用户身上得到的东西的性质变得更加特定于领域。领域特定性越强,可重用性越差。