R 用SPADE解释序列挖掘结果_R_Algorithm_Sequences

R 用SPADE解释序列挖掘结果

r algorithm

R 用SPADE解释序列挖掘结果,r,algorithm,sequences,R,Algorithm,Sequences,请帮助解释SPADE频繁序列挖掘算法的结果() 支持度=0.05时： s1 <- cspade(x, parameter = list(support = 0.05), control = list(verbose = TRUE)) s1使用SPADE算法时，请记住您也在处理时态数据（即，您可以知道项目的出现顺序或时间）看起来这是相同的序列，不是吗？如何语义上与现实生活中的例子不同在您的示例中，表示项目C首先出现，然后是项目V；表示项目C和V同时出现然后，例如，如果：

请帮助解释SPADE频繁序列挖掘算法的结果()

支持度=0.05时：

s1 <- cspade(x, parameter = list(support = 0.05), control = list(verbose = TRUE))

s1使用SPADE算法时，请记住您也在处理时态数据（即，您可以知道项目的出现顺序或时间）
看起来这是相同的序列，不是吗？如何
语义上与现实生活中的例子不同
在您的示例中，表示项目C首先出现，然后是项目V；表示项目C和V同时出现
然后，例如，如果：
            sequence    support
1              <{C}> 1.00000000

            sequence    support
1              <{C}> 1.00000000

序列支持
1               1.00000000

这是否意味着序列包含在所有序列中
数据库D，对吗
支持值为1的项目意味着它发生在所有交易中（在市场篮子分析示例中）
希望这有帮助
看起来这是相同的序列，不是吗？如何
语义上与现实生活中的例子不同
正如user2552108所指出的，{C，V}意味着C和V同时发生。实际上，这可以用来编码多维序列数据。例如，假设C是加拿大，V是温哥华。现在可能是这样的：
[{C，V，M，花生，黄油，枫糖浆，{}]
在这种情况下，频繁项集不仅可以有单个长度集，如{C}、{V}、{U}、{W}或{X}，还可以有长度大于1的集（同时出现的集）
因此，事务/序列中的元素被定义为集合而不是单个元素
这是否意味着序列包含在所有序列中
数据库D，对吗
没错！您好！虽然我可以从数据中创建事务矩阵，但由于错误“eid”无效，我无法运行spade。这是线程，…您能帮我吗？？
> as(s1, "data.frame")
            sequence    support
1              <{C}> 1.00000000
2              <{L}> 0.20468120
3              <{V}> 0.73127376
4          <{C},{V}> 0.15644023
5            <{C,V}> 0.73127376
6            <{L,V}> 0.07882027
7          <{V},{V}> 0.13343431
8        <{C,V},{V}> 0.13343431
9      <{C},{C},{V}> 0.05558572
10         <{C,L,V}> 0.07882027
11       <{V},{C,V}> 0.13343431
12       <{C},{C,V}> 0.15644023
13     <{C,V},{C,V}> 0.13343431
14   <{C},{C},{C,V}> 0.05558572
15         <{C},{L}> 0.05738619
16           <{C,L}> 0.20468120
17       <{C},{C,L}> 0.05738619
18         <{C},{C}> 0.22128547
19         <{L},{C}> 0.06233031
20         <{V},{C}> 0.16921494
21     <{V},{V},{C}> 0.05047012
22     <{V},{C},{C}> 0.06233031
23       <{C,V},{C}> 0.16921494
24     <{C},{V},{C}> 0.05781487
25   <{C,V},{V},{C}> 0.05047012
26   <{V},{C,V},{C}> 0.05047012
27   <{C},{C,V},{C}> 0.05781487
28 <{C,V},{C,V},{C}> 0.05047012
29       <{C,L},{C}> 0.06233031
30     <{C},{C},{C}> 0.07882027
31   <{C,V},{C},{C}> 0.06233031
> summary(s1)
set of 31 sequences with

most frequent items:
      C       V       L (Other) 
     27      22       8       8 

most frequent elements:
    {C}     {V}   {C,V}     {L}   {C,L} (Other) 
     21      12      12       3       3       2 

element (sequence) size distribution:
sizes
 1  2  3 
 7 13 11 

sequence length distribution:
lengths
 1  2  3  4  5 
 3  9 12  6  1 

summary of quality measures:
    support       
 Min.   :0.05047  
 1st Qu.:0.05760  
 Median :0.07882  
 Mean   :0.17121  
 3rd Qu.:0.16283  
 Max.   :1.00000  

includes transaction ID lists: FALSE 

mining info:
 data ntransactions nsequences support
    x         61000      34991    0.05
> 

            sequence    support
1              <{C}> 1.00000000