R 从数据集中读取项

R 从数据集中读取项,r,rstudio,R,Rstudio,我下载了一个文件,每个列中都包含一个csv格式的项目或空单元格。当我编写代码时: groceries_data = groceries_data <- read.transactions("groceries.csv") 但是当我写代码的时候 groceries_data = read.transactions("groceries.csv",sep=",") 结果是: summary(groceries_data) transactions as itemMatrix in spar

我下载了一个文件,每个列中都包含一个csv格式的项目或空单元格。当我编写代码时:

groceries_data = groceries_data <- read.transactions("groceries.csv")
但是当我写代码的时候

groceries_data = read.transactions("groceries.csv",sep=",")
结果是:

summary(groceries_data)
transactions as itemMatrix in sparse format with
 9835 rows (elements/itemsets/transactions) and
 169 columns (items) and a density of 0.02609146 

这是书中正确的结果,但从逻辑上讲,它应该使用第一个命令,而不是第二个命令。这里出了什么问题?

默认情况下,该函数不适用于CSV。请参阅
帮助(read.transactions)
-以了解
sep
参数的说明:

指定字段在数据文件中的分隔方式的字符串。默认值(“”)在空白处拆分

所以除非你告诉它用逗号分开,否则它就是在每个空格上分开。如果在许多产品名称中有空格,那么每个产品名称的每个单词都将成为一列

通过将
sep
参数指定为逗号,它可以按照您的需要正确导入CSV文件

summary(groceries_data)
transactions as itemMatrix in sparse format with
 9835 rows (elements/itemsets/transactions) and
 169 columns (items) and a density of 0.02609146