R中基于arules包的关联规则挖掘_R_Sparse Matrix_Arules

R中基于arules包的关联规则挖掘

R中基于arules包的关联规则挖掘,r,sparse-matrix,arules,R,Sparse Matrix,Arules,我正在尝试使用R中的arules包查找关联规则。我正在使用csv文件创建事务对象。我得到一个不正确的项目集。这就是数据的样子 137,lidocaine 138,pregabalin 139,esomeprazole,nadolol,atorvastatin 140,hydromorphone 141,ondansetron,enoxaparin,metoclopramide 142,fluticasone 143,trandolapril,amlodipine,fluticasone,eso

我正在尝试使用R中的

arules

包查找关联规则。我正在使用csv文件创建事务对象。我得到一个不正确的项目集。这就是数据的样子

137,lidocaine
138,pregabalin
139,esomeprazole,nadolol,atorvastatin
140,hydromorphone
141,ondansetron,enoxaparin,metoclopramide
142,fluticasone
143,trandolapril,amlodipine,fluticasone,esomeprazole
144,meloxicam
145,lidocaine
146,atorvastatin
147,fluticasone
here is the R code I am using
library("arules")
txn <- read.transactions("basket.csv", rm.duplicates= TRUE,format="basket",sep=",",cols =1);
txn@itemInfo
The item list I am getting has repeated items
labels
1       amlodipine
2    atorvastatin"
3       enoxaparin
4     esomeprazole
5    esomeprazole"
6      fluticasone
7     fluticasone"
8   hydromorphone"
9       lidocaine"
10      meloxicam"
11 metoclopramide"
12         nadolol
13     ondansetron
14     pregabalin"
15    trandolapril

137，利多卡因
138，普瑞巴林
139，埃索美拉唑，纳多洛，阿托伐他汀
140，氢吗啡酮
141，昂丹司琼，依诺肝素，甲氧氯普胺
142，氟替卡松
143，曲多普利，氨氯地平，氟替卡松，埃索美拉唑
144，美洛昔康
145，利多卡因
146，阿托伐他汀
147，氟替卡松
这是我正在使用的R代码
图书馆（“阿鲁莱斯”）
txn我不熟悉R工具，但我是一名人工智能学生，对关联规则略知一二
我认为这与你的数据文件有关。如果您注意到项目列表，您将看到数据文件中每一行末尾的项目在项目列表中都出现了引号，反之亦然
因此，出现两次的原因是它们出现在一行的末尾，另一次出现在日期文件中线。
重复一遍，我不熟悉R工具，但我认为一个简单的更正，例如在数据文件的所有行末尾添加一个空格，就可以解决这个问题。
谢谢编码器，我知道发生了什么，即在行的中间、开头或结尾出现了一个项目。引号是我唯一无法理解的东西。但当我从txt文件中读取相同的数据时，这个问题不会出现，所以我猜这是csv问题