Graph 使用自然语言处理（NLP）从文本（即非正式图形'；模式'；）推断图形数据库顶点/边-是否存在这种情况？_Graph_Neo4j_Nlp_Titan_Linguistics

Graph 使用自然语言处理（NLP）从文本（即非正式图形'；模式'；）推断图形数据库顶点/边-是否存在这种情况？

graph neo4j nlp

Graph 使用自然语言处理（NLP）从文本（即非正式图形'；模式'；）推断图形数据库顶点/边-是否存在这种情况？,graph,neo4j,nlp,titan,linguistics,Graph,Neo4j,Nlp,Titan,Linguistics,注意：我既不是语言学家，也不是图理论家，但是，我是一名[Java]开发人员，希望使用图数据库实现持久性，以下主题我感兴趣，我希望其他人也感兴趣好的，我们的想法是使用一些应用程序或代码来：识别给定文本中命名实体之间的嵌入关系结构在图形数据库结构中应用或公开这些发现的关系在这样一个系统中，文本基本上可以形成一个基本的、门外汉编写的各种图形模式。为了更好地体现这一点，这里有一些[非常]基本的文本： Andrew is married to Jane 使用，我得到以下信息： Andrew_NP

注意：我既不是语言学家，也不是图理论家，但是，我是一名[Java]开发人员，希望使用图数据库实现持久性，以下主题我感兴趣，我希望其他人也感兴趣

好的，我们的想法是使用一些应用程序或代码来：

识别给定文本中命名实体之间的嵌入关系结构

在图形数据库结构中应用或公开这些发现的关系

在这样一个系统中，文本基本上可以形成一个基本的、门外汉编写的各种图形模式。为了更好地体现这一点，这里有一些[非常]基本的文本：

Andrew is married to Jane

使用，我得到以下信息：

Andrew_NP0 is_VBZ married_AJ0 to_SENT Jane_NP0

根据“@Oxford University，NP0='property noon'，这是一个名称（如您所知），但这些NP0标记的条目将有助于成为graph vertice实例/节点（最终用户可能会被进一步提示为这些条目提供一个包含在内的“类型/描述”）。动词“VBZ”和形容词AJ0可能会突出显示图形关系

一旦最终用户确认了他们的图形表示，他们可能会将其导出到，以便重新导入到图形数据库中，如或

因此，总体想法是要有一个工具，让外行最终用户能够使用日常语言创建基于图论的数据库结构

这样的工具是否已经存在

我以上的一些观察结果在某种程度上受到以下工具（以及其他工具）的影响：

是的，这存在于许多不同的地方。例子包括（路透社创建的）和。还有一系列其他的工具包和API，比如，它们并没有向您提供一个完整的解决方案，而是一系列构建定制解决方案所必需的工具

这是一个非常深入的领域，有待继续研究。这里我不能涵盖所有内容，但有一点需要记住，这一领域中的解决方案通常非常特定于特定的文档“语料库”。能很好地处理任意英文文本的软件实际上并不存在。相反，您看到的是在商业新闻稿中做得非常好的解决方案。或者情报报告。或报纸文章。或医疗警报。但不是任意的文本

这个地区也充满了很多问题；其中一个大的是被称为“”

安德鲁和简结婚了。安德鲁昨天买了鸡蛋

这里讨论了多少人？第二个和第一个一样吗？这是一个非常复杂的背景问题。但您最好把它弄对，否则结果图中的“person”节点可能会比您预期的多或少。

谢谢您的快速回答。我知道NLTK和OpenCalais（我使用过在线查看器）。是的，您关于命名实体的观点非常有效，但是，我的“建议”解决方案可能会尝试让最终用户识别并关联提取的实体，以便跨子句跟踪它们（即，根据输入文本创建排序字典）。正如我所说，我不是一个专家，我只是觉得整个NLP的想法非常吸引人（再次感谢）。许多这样的方法已经建立起来——它们被归类为“半自动”文本提取。你可以搜索文献；不过，这是可重用的，这很值得怀疑，因为当你走上半自动化的路线时，你需要从用户身上得到的东西的性质变得更加特定于领域。领域特定性越强，可重用性越差。