Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/algorithm/11.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Algorithm 树木之间的相似性_Algorithm_Tree_String Matching_Similarity - Fatal编程技术网

Algorithm 树木之间的相似性

Algorithm 树木之间的相似性,algorithm,tree,string-matching,similarity,Algorithm,Tree,String Matching,Similarity,我正在研究一个在图上对关键字搜索结果进行聚类的问题。结果是以树的形式出现的,我需要根据它们的相似性对这三个进行分组。树的每个节点都有两个键,一个是SQL数据库中的表名(语义形式),另一个是该表记录的实际值(标签) 我使用了Zhang和Shasha、Klein、Demaine和RTED算法来查找基于这两个键的树之间的树编辑距离。所有算法都不使用删除/插入/重新标记操作,需要修改树以使它们看起来相同 **我需要更多的矩阵来检查两棵树之间的相似性,例如节点数、平均扇形等,以便我可以对这些矩阵进行加权平

我正在研究一个在图上对关键字搜索结果进行聚类的问题。结果是以树的形式出现的,我需要根据它们的相似性对这三个进行分组。树的每个节点都有两个键,一个是SQL数据库中的表名(语义形式),另一个是该表记录的实际值(标签)

我使用了Zhang和Shasha、Klein、Demaine和RTED算法来查找基于这两个键的树之间的树编辑距离。所有算法都不使用删除/插入/重新标记操作,需要修改树以使它们看起来相同

**我需要更多的矩阵来检查两棵树之间的相似性,例如节点数、平均扇形等,以便我可以对这些矩阵进行加权平均,从而得出一个非常好的相似性矩阵,该矩阵同时考虑了树(结构)的语义形式和树中包含的信息(节点上的标签)

你能给我建议一些出路或者一些有帮助的文献吗**

有人能给我推荐一些好论文吗

即使你有每对可能的树之间的(伪)距离,这实际上不是你想要的。你实际上想做无监督学习(聚类)将结构学习与参数学习相结合。要对其进行推理的数据结构类型是树。假设“某些度量空间”对于您的聚类方法,您介绍了一些实际上并不必要的内容。要找到合适的距离度量值是一个非常困难的问题。我将在下面的段落中指出不同的方向,希望它们能够帮助您

以下不是表示此问题的唯一方法…您可以将您的问题视为对所有可能的树进行的贝叶斯推理,在树节点上具有所有可能的值。您可能对哪些类型的树比其他树更可能和/或哪些类型的值比其他树更可能有一些先验知识。贝叶斯方法允许您为两者定义先验

您可能喜欢阅读的一篇文章是Meila和Jordan的“使用树的混合物学习”,2000()。它解释了可以使用可分解的先验值:树结构的先验值与值/参数不同(这当然意味着这里有一些独立性的假设)

我知道你在暗示启发式,如平均扇出等,但你可能会发现值得检查这些贝叶斯推理的新应用。例如,请注意,在非参数贝叶斯方法中,对无限树进行推理也是可行的,例如Hutter,2004()