“错误”;只能强制使用原子组件的列表”;当转换为事务时,使用arules
我有一个数据框,它看起来像这样:“错误”;只能强制使用原子组件的列表”;当转换为事务时,使用arules,r,apriori,arules,R,Apriori,Arules,我有一个数据框,它看起来像这样: str(df) 'data.frame': 174671 obs. of 3 variables: $ COD_PRODUCT: Factor w/ 338 levels "001CH","002CO",..: 1 1 1 1 1 1 1 1 1 1 ... $ STORE : Factor w/ 15 levels "Barcelona","Florencia",..: 4 13 4 5 11 12 5 13 1 12 ... $ SE
str(df)
'data.frame': 174671 obs. of 3 variables:
$ COD_PRODUCT: Factor w/ 338 levels "001CH","002CO",..: 1 1 1 1 1 1 1 1 1 1 ...
$ STORE : Factor w/ 15 levels "Barcelona","Florencia",..: 4 13 4 5 11 12 5 13 1 12 ...
$ SELL_ID : Factor w/ 74327 levels "BA0000000","BA0000001",..: 28696 65976 27147 14291 51141 59023 12249 61636 5495 59314 ...
这些因素中既没有NAs值,也没有无效值,我们可以在这里看到:
print(unlist(lapply(df, function(x) any(is.na(x)))))
COD_PRODUCT STORE SELL_ID
FALSE FALSE FALSE
我的目标是创建一个数据挖掘模型(关联规则),为此,我以前成功地导入了包arules。我遵循的下一步是将df拆分为一个列表,并应用一个操作来消除重复出现的情况,例如:
ppvt <- split(x = df[, c("COD_PRODUCT", "STORE")], f = df$SELL_ID)
ppvt <- lapply (ppvt, unique)
对此一无所知(是的,你可以想象,我来这里之前在互联网上搜索了很多)。你有办法解决这个问题吗
任何帮助都将不胜感激
尊敬的,您能否在开始以下活动之前查看课程(ppvt):
ppvt您能否提供一个可复制的问题示例(即,我们可以下载并运行代码和数据)?查看
str(ppvt)
,您将看到列表中的每个元素都是一个数据框。为了转换成事务,你需要列表中的每个元素都是一个向量。如果你想提供下面的答案,我会给你评分:)谢谢合作。
ppvt <- as (ppvt, "transactions" )
Error in asMethod(object) : can coerce list with atomic components only