将.csv文件读取为read.transactions,以便在R中应用ariori()?

将.csv文件读取为read.transactions,以便在R中应用ariori()?,r,transactions,type-conversion,categorical-data,apriori,R,Transactions,Type Conversion,Categorical Data,Apriori,我有.csv数据,其中包含列和5000行,如下所示: age sex children distance 1 0 1 1 1 1 1 2 2 1 0 1 1 0 1 3 3 1 0 2 1 1 1 1 mar = read.transact

我有.csv数据,其中包含列和5000行,如下所示:

age sex children distance  
  1   0        1        1    
  1   1        1        2   
  2   1        0        1    
  1   0        1        3    
  3   1        0        2   
  1   1        1        1 
mar = read.transactions("Marketing campaign.csv", format = "basket", 
                        sep = ",", cols = c("age", "sex", "children", "distance"))  
我想使用
apriori()
应用关联规则挖掘。 因此,尝试使用
read.transactions
读取数据集,如下所示:

age sex children distance  
  1   0        1        1    
  1   1        1        2   
  2   1        0        1    
  1   0        1        3    
  3   1        0        2   
  1   1        1        1 
mar = read.transactions("Marketing campaign.csv", format = "basket", 
                        sep = ",", cols = c("age", "sex", "children", "distance"))  
但我得到了以下错误:

read.transactions(“Marketing campaign.csv”,format=“basket”中出错):“cols”必须是“basket”的数字标量


请帮助。在R中,保存类别变量的数据类型称为
factor
。可以使用
as.factor
factor
方法轻松创建因子向量

myDf <- data.frame(
  age = c(1,1,2,1,3,1),
  sex = c(1,1,1,0,1,1),
  children = c(1,1,0,1,0,1),
  distance = c(0,2,1,3,2,1)
)

myDf
#   age sex children distance
# 1   1   1        1        0
# 2   1   1        1        2
# 3   2   1        0        1
# 4   1   0        1        3
# 5   3   1        0        2
# 6   1   1        1        1

myDf$sex <- factor(myDf$sex, labels = c("F", "M"))

myDf
#   age sex children distance
# 1   1   M        1        0
# 2   1   M        1        2
# 3   2   M        0        1
# 4   1   F        1        3
# 5   3   M        0        2
# 6   1   M        1        1

myDf尝试使用
as.factor
instad of
as.character
您可以使用
read.csv
中的
colClasses
参数为每列指定类,如下所示:
dat另请参见:但我有5000行这样的组合。然后,我需要应用apriori()在此基础上,即使在转换因子后,也表明没有将“tbl_df”强制为“事务”的方法或默认值我不明白行数在这里有什么不同。关于
事务
:这是一个与您之前问的问题完全不同的问题。在
arules
页面中,有一个特定的类称为
事务
。如果您需要帮助,请在问题中提及这一点。是否可能<代码>as.事务
在数据帧上工作,但不在
tbl_df
s上工作?