将.csv文件读取为read.transactions，以便在R中应用ariori（）？_R_Transactions_Type Conversion_Categorical Data_Apriori

将.csv文件读取为read.transactions，以便在R中应用ariori（）？

r transactions

将.csv文件读取为read.transactions，以便在R中应用ariori（）？,r,transactions,type-conversion,categorical-data,apriori,R,Transactions,Type Conversion,Categorical Data,Apriori,我有.csv数据，其中包含列和5000行，如下所示： age sex children distance 1 0 1 1 1 1 1 2 2 1 0 1 1 0 1 3 3 1 0 2 1 1 1 1 mar = read.transact

我有.csv数据，其中包含列和5000行，如下所示：

age sex children distance  
  1   0        1        1    
  1   1        1        2   
  2   1        0        1    
  1   0        1        3    
  3   1        0        2   
  1   1        1        1

mar = read.transactions("Marketing campaign.csv", format = "basket", 
                        sep = ",", cols = c("age", "sex", "children", "distance"))

我想使用

apriori（）

应用关联规则挖掘。因此，尝试使用

read.transactions

读取数据集，如下所示：

age sex children distance  
  1   0        1        1    
  1   1        1        2   
  2   1        0        1    
  1   0        1        3    
  3   1        0        2   
  1   1        1        1

mar = read.transactions("Marketing campaign.csv", format = "basket", 
                        sep = ",", cols = c("age", "sex", "children", "distance"))

但我得到了以下错误：

read.transactions（“Marketing campaign.csv”，format=“basket”中出错）：“cols”必须是“basket”的数字标量

请帮助。在R中，保存类别变量的数据类型称为

factor

。可以使用

as.factor

和

factor

方法轻松创建因子向量

myDf <- data.frame(
  age = c(1,1,2,1,3,1),
  sex = c(1,1,1,0,1,1),
  children = c(1,1,0,1,0,1),
  distance = c(0,2,1,3,2,1)
)

myDf
#   age sex children distance
# 1   1   1        1        0
# 2   1   1        1        2
# 3   2   1        0        1
# 4   1   0        1        3
# 5   3   1        0        2
# 6   1   1        1        1

myDf$sex <- factor(myDf$sex, labels = c("F", "M"))

myDf
#   age sex children distance
# 1   1   M        1        0
# 2   1   M        1        2
# 3   2   M        0        1
# 4   1   F        1        3
# 5   3   M        0        2
# 6   1   M        1        1

myDf尝试使用as.factor
instad ofas.character
您可以使用read.csv
中的colClasses
参数为每列指定类，如下所示：dat另请参见：但我有5000行这样的组合。然后，我需要应用apriori（）在此基础上，即使在转换因子后，也表明没有将“tbl_df”强制为“事务”的方法或默认值我不明白行数在这里有什么不同。关于事务
：这是一个与您之前问的问题完全不同的问题。在arules
页面中，有一个特定的类称为事务
。如果您需要帮助，请在问题中提及这一点。是否可能<代码>as.事务
在数据帧上工作，但不在tbl_df
s上工作？