Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/ruby-on-rails-4/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Data structures 哪种类型的树数据结构适合高效的频繁模式挖掘?_Data Structures_Information Retrieval_Trie - Fatal编程技术网

Data structures 哪种类型的树数据结构适合高效的频繁模式挖掘?

Data structures 哪种类型的树数据结构适合高效的频繁模式挖掘?,data-structures,information-retrieval,trie,Data Structures,Information Retrieval,Trie,我目前正在进行频繁模式挖掘FPM。我在谷歌上搜索可用于FPM的数据结构。我主要关心的是数据结构的空间紧凑性,因为am计划在其上使用分布式算法处理适合我主内存的DS上的同步。我遇到的数据结构列表是 前缀树 紧凑前缀树或基数树 前缀哈希树PHT Burst Tree当前正在阅读它的工作原理 我不知道每个数据结构的演变顺序。有人能告诉我哪些DS(不限于上述DS)是符合我要求的最佳数据结构吗 附言:目前我正在考虑突发树是FPM最著名的节省空间的数据结构。我同意这个问题很广泛。但是,如果您正在寻找一个节省

我目前正在进行频繁模式挖掘FPM。我在谷歌上搜索可用于FPM的数据结构。我主要关心的是数据结构的空间紧凑性,因为am计划在其上使用分布式算法处理适合我主内存的DS上的同步。我遇到的数据结构列表是

前缀树 紧凑前缀树或基数树 前缀哈希树PHT Burst Tree当前正在阅读它的工作原理 我不知道每个数据结构的演变顺序。有人能告诉我哪些DS(不限于上述DS)是符合我要求的最佳数据结构吗


附言:目前我正在考虑突发树是FPM最著名的节省空间的数据结构。

我同意这个问题很广泛。但是,如果您正在寻找一个节省空间的前缀树,那么我强烈推荐一个。我编写了一个实现,能够为Stripe的最新捕获标志节省大量空间。他们遇到了一个问题,使用了4个节点,每个节点的大小都小于500mb,需要一个后缀树

如果您正在寻找一个高效的突发trie的实现,那么请查看我的


你的问题太宽泛了。您使用的数据结构可能没有您选择的算法重要。典型的例子是Apriori算法,但如果数据适合内存,则还有其他选择Eclat和FP-Growth。但是,如果不了解数据的性质,就不可能推荐数据结构。您同步访问的意图也将影响该决策。你是在问如何表示你正在挖掘的数据,还是如何表示中间结果?@JimMischel:不是这样,先生。每个算法,包括矩、IncMine、FP-Growth、APstream等,都有一些共同的步骤。决定其性能的唯一因素是使用高效的数据结构。一个简单的例子是封闭枚举树从前缀树演化而来,原因是前缀树不适合内存。在这里,算法不是一个大问题。我们如何存储中间结果很重要,因为数据结构会产生影响。这就是为什么我更关心数据结构而不是算法。