Apriori,arulesSequences,在R中:它是否支持;篮子;(单次购物行程中的订单无关紧要)?

Apriori,arulesSequences,在R中:它是否支持;篮子;(单次购物行程中的订单无关紧要)?,r,apriori,arules,pattern-mining,R,Apriori,Arules,Pattern Mining,我开始使用arulesSequences,目的是对我拥有的一些数据执行频繁的序列挖掘。存储a的数据如下所示: 客户ID序号购买物品的数量 117399 12{100100} 21739921{800} 3 17399 3 2{900900} 41739941405} 517399 5 4{200505200505} 这意味着该客户#17399多次使用该商店A购物。在他/她的第一次购物旅行中,此人购买了商品代码为100和100的商品(2个商品)。在他/她的第二次购物之旅中,该客户仅购买了商品800

我开始使用arulesSequences,目的是对我拥有的一些数据执行频繁的序列挖掘。存储a的数据如下所示:

客户ID序号购买物品的数量

117399 12{100100}

21739921{800}

3 17399 3 2{900900}

41739941405}

517399 5 4{200505200505}

这意味着该客户#17399多次使用该商店A购物。在他/她的第一次购物旅行中,此人购买了商品代码为100和100的商品(2个商品)。在他/她的第二次购物之旅中,该客户仅购买了商品800。等等

现在我想在这个客户身上使用cSPADE,在这个客户身上,订单在“购物篮”内并不重要,但在整个购物行程中都很重要。因此,最终我对客户17399的记录是:

客户ID购买的物品

17399{(100100),800,(900900),405,(200505200505)}

其中{}包含完整序列,()表示每次购物行程

我大体上理解这是一种可能性。但是,我还没有看到任何例子(几个小时的搜索)或注释明确地谈论支持这一点的arulesSequences。有什么想法吗?谢谢你的帮助


谢谢你抽出时间

经过几个小时的研究,我正在添加我发现的答案,以防对其他人有用

答案是肯定的-该包确实支持跨篮子的重复项目。事实上,这个网站上的例子显示了这种情况。虽然本例中没有两个序列号(属于同一事务)相同,但存在重叠元素。即使它们是相同的(我使用了示例input.txt),当您使用read_basket和cSPADE时也没有错误,这正是我试图应用的

网络上的许多例子都是针对apriori的,对于apriori来说,篮子中的重复项目是不允许的。这会引起很多混乱。上面粘贴的示例很好地展示了cSPADE的使用。希望这能帮助外面的人们