Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/sql/73.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Mysql 基于SQL的FP-Growth算法_Mysql_Sql_Database_Data Mining_Fpgrowth - Fatal编程技术网

Mysql 基于SQL的FP-Growth算法

Mysql 基于SQL的FP-Growth算法,mysql,sql,database,data-mining,fpgrowth,Mysql,Sql,Database,Data Mining,Fpgrowth,因此,我有一个名为tru table的项目集示例,如下所示: +---------+-----------+ | tr_kode | item| +---------+-----------+ | T1 | 1 | | T1 | 2 | | T1 | 2 | | T1 | 5 | | T2 | 1 | | T2 | 3 | | T2

因此,我有一个名为tru table的项目集示例,如下所示:

+---------+-----------+
| tr_kode | item|
+---------+-----------+
| T1      |         1 |
| T1      |         2 |
| T1      |         2 |
| T1      |         5 |
| T2      |         1 |
| T2      |         3 |
| T2      |         4 |
| T2      |         5 |
| T2      |         6 |
| T3      |         1 |
| T3      |         2 |
| T4      |         4 |
| T4      |         2 |
| T4      |         6 |
| T5      |         6 |
| T5      |         5 |
| T5      |         4 |
| T6      |         3 |
| T6      |         6 |
| T6      |         2 |
| T7      |         2 |
| T7      |         1 |
| T7      |         7 |
+---------+-----------+
然后我将最小支持设置为20%,并对名为freq\u item的表进行频繁项查看。此视图包含已排序的选定频繁项

+------+-----------+
| item | suppCount |
+------+-----------+
|    2 |         6 |
|    1 |         4 |
|    6 |         4 |
|    4 |         3 |
|    5 |         3 |
|    3 |         2 |
+------+-----------+
在这之后,我已经得到了一个已被选择和排序的事务表,它被称为selected\u tr

+------+------+
| tid  | item |
+------+------+
| T1   |    2 |
| T1   |    1 |
| T1   |    5 |
| T2   |    1 |
| T2   |    6 |
| T2   |    4 |
| T2   |    5 |
| T2   |    3 |
| T3   |    2 |
| T3   |    1 |
| T4   |    2 |
| T4   |    6 |
| T4   |    4 |
| T5   |    6 |
| T5   |    4 |
| T5   |    5 |
| T6   |    2 |
| T6   |    6 |
| T6   |    3 |
| T7   |    2 |
| T7   |    1 |
+------+------+

我想问的是,如何从所选的树构建fp树,然后根据fp增长算法找到频繁模式。谢谢你了。

我想你不行。您甚至会如何在SQl中表示FPtree?另外,这个构造是一个迭代过程,是SQL真正避免的。“另外,这个构造是一个迭代过程,是SQL真正避免的”@Anony Mouse uhm MySQL支持(存储)过程已经有一段时间了?或者我没有理解你真正的观点?但在这篇文章中说这是可能的,只是我很难理解他是怎么做到的@RaymondNijland:MySQL扩展?您对该语句有ANSI SQL定义吗?但是继续吧,浪费你的时间在mySQL中实现FPgrowth。然后针对SQL之外的实现进行基准测试,例如pyfim。“MySQL扩展?您有该语句的ANSI SQL定义吗?”MySQL SQL方言被标记,因此ANSI/ISO SQL标准在@Anony Mouse中并不重要。。。但是,如果您想找到SQL/PSM,请研究ANSI/ISO SQL标准中的SQL/PSM。。。