将.csv文件读取为read.transactions,以便在R中应用ariori()?
我有.csv数据,其中包含列和5000行,如下所示:将.csv文件读取为read.transactions,以便在R中应用ariori()?,r,transactions,type-conversion,categorical-data,apriori,R,Transactions,Type Conversion,Categorical Data,Apriori,我有.csv数据,其中包含列和5000行,如下所示: age sex children distance 1 0 1 1 1 1 1 2 2 1 0 1 1 0 1 3 3 1 0 2 1 1 1 1 mar = read.transact
age sex children distance
1 0 1 1
1 1 1 2
2 1 0 1
1 0 1 3
3 1 0 2
1 1 1 1
mar = read.transactions("Marketing campaign.csv", format = "basket",
sep = ",", cols = c("age", "sex", "children", "distance"))
我想使用apriori()
应用关联规则挖掘。
因此,尝试使用read.transactions
读取数据集,如下所示:
age sex children distance
1 0 1 1
1 1 1 2
2 1 0 1
1 0 1 3
3 1 0 2
1 1 1 1
mar = read.transactions("Marketing campaign.csv", format = "basket",
sep = ",", cols = c("age", "sex", "children", "distance"))
但我得到了以下错误:
read.transactions(“Marketing campaign.csv”,format=“basket”中出错):“cols”必须是“basket”的数字标量
请帮助。在R中,保存类别变量的数据类型称为
factor
。可以使用as.factor
和factor
方法轻松创建因子向量
myDf <- data.frame(
age = c(1,1,2,1,3,1),
sex = c(1,1,1,0,1,1),
children = c(1,1,0,1,0,1),
distance = c(0,2,1,3,2,1)
)
myDf
# age sex children distance
# 1 1 1 1 0
# 2 1 1 1 2
# 3 2 1 0 1
# 4 1 0 1 3
# 5 3 1 0 2
# 6 1 1 1 1
myDf$sex <- factor(myDf$sex, labels = c("F", "M"))
myDf
# age sex children distance
# 1 1 M 1 0
# 2 1 M 1 2
# 3 2 M 0 1
# 4 1 F 1 3
# 5 3 M 0 2
# 6 1 M 1 1
myDf尝试使用as.factor
instad ofas.character
您可以使用read.csv
中的colClasses
参数为每列指定类,如下所示:dat另请参见:但我有5000行这样的组合。然后,我需要应用apriori()在此基础上,即使在转换因子后,也表明没有将“tbl_df”强制为“事务”的方法或默认值我不明白行数在这里有什么不同。关于事务
:这是一个与您之前问的问题完全不同的问题。在arules
页面中,有一个特定的类称为事务
。如果您需要帮助,请在问题中提及这一点。是否可能<代码>as.事务
在数据帧上工作,但不在tbl_df
s上工作?