Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/database/8.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Database 如何使用图形数据库关联单词一致性和文档_Database_Text_Graph_Documents - Fatal编程技术网

Database 如何使用图形数据库关联单词一致性和文档

Database 如何使用图形数据库关联单词一致性和文档,database,text,graph,documents,Database,Text,Graph,Documents,我看到一些教程提到将数据导入{Neo4j,titan,…}图DBs。关于如何将其应用到我们的学术项目中,我有一些问题 在本例中,我们有一组pdf和Microsoft Word格式的文档(目前不太重要),我们希望通过全局主题来关联这些文档。在这种情况下,使用{Neo4j,titan,…}很容易将溶液可视化;然而,我认为还有一个更为特殊的情况。文档中存在的一些概念必须在图形中关联。在这种情况下,我们已经明确指出了这些概念,它们几乎总是由多词术语(例如“人工神经网络”)表示,我们希望将它们作为一组文档

我看到一些教程提到将数据导入{Neo4j,titan,…}图DBs。关于如何将其应用到我们的学术项目中,我有一些问题

在本例中,我们有一组pdf和Microsoft Word格式的文档(目前不太重要),我们希望通过全局主题来关联这些文档。在这种情况下,使用{Neo4j,titan,…}很容易将溶液可视化;然而,我认为还有一个更为特殊的情况。文档中存在的一些概念必须在图形中关联。在这种情况下,我们已经明确指出了这些概念,它们几乎总是由多词术语(例如“人工神经网络”)表示,我们希望将它们作为一组文档在文档中进行关联,并可以查询文档中使用任何查询术语的任何上下文(一致性).

最后一个任务(concordences)目前是使用关系数据库完成的,但我们希望将所有任务集中到一个唯一的数据库中,我们认为它必须是一个图数据库{Neo4j,titan,…}

我们希望您能对我们如何将我们的问题应用到{Neo4j,titan,…}图形数据库中有一点了解。可能是关于类似示例的文档(如果存在),关于导入数据结构的可能方式的一般视图。。。你知道

我希望不要这么模棱两可。
提前非常感谢。

这个问题仍然有点宽泛,但我会尝试快速回答我所理解的问题

您可以用一种简单的方式开始“模式”(或图形结构):

  • 为多词术语创建节点
  • 为文档创建节点
  • 每次有一致性时,您都可以在两个各自的端点(术语、文档)之间创建链接
我建议在继续处理/导入之前将所有数据规范化为单一格式:通用格式通常是CSV,但您也可以查看(GraphDB广泛支持)或


如果您想浏览一些图表的“模式”,请查看:这是一个包含各种主题的广泛集合,您可以使用这些主题来启发您的结构。

嗨,Marco,谢谢您的回答。我还有一些疑问。是否可以将文档放入Neo4j中?或者我需要另一个面向RI的DB来管理文档,而Neo4j只用于关联文档(以及不同级别的所需内容)。其实我不是星展银行的专家,对不起…我明白了。也许您可以看看OrientDB,它是一种混合文档GraphDB: