R-如何为不同长度的数据创建事务矩阵。用于关联挖掘

R-如何为不同长度的数据创建事务矩阵。用于关联挖掘,r,sqldf,arules,R,Sqldf,Arules,描述:我有一个包含患者ID和诊断ID的数据集。每个患者可能有1到20个诊断 目标:我需要将我的数据框架转换为交易矩阵,用于市场篮子分析 问题:到目前为止,我在使用用于生成事务矩阵的常规工具时遇到了问题,我相信这是因为每个PID记录的长度不同 我尝试的内容:我使用“arules”包试图通过将数据作为事务矩阵读取,将数据转换为事务矩阵 这导致了以下错误: 'read.transactions(“intermediate.csv”,format=“single”,cols=c(“pid”)中出现错误:

描述:我有一个包含患者ID和诊断ID的数据集。每个患者可能有1到20个诊断

目标:我需要将我的数据框架转换为交易矩阵,用于市场篮子分析

问题:到目前为止,我在使用用于生成事务矩阵的常规工具时遇到了问题,我相信这是因为每个PID记录的长度不同

我尝试的内容:我使用“arules”包试图通过将数据作为事务矩阵读取,将数据转换为事务矩阵

这导致了以下错误: 'read.transactions(“intermediate.csv”,format=“single”,cols=c(“pid”)中出现错误: “cols”必须是数字(仅允许header=TRUE使用字符)'

最初,这个错误使我相信列的数据类型不正确(非数字),尽管在写入文件并将其作为事务读回之前,我已在行中将其数据类型明确设置为数字。我已通过将文件读回(而不是作为事务)来确认该文件符合我所需的格式

关于如何继续,我会使用“sqldf”来尝试让它也能工作,尽管我更喜欢将它保存在“arules”库中


谢谢。

答案很快就出来了,但我可以把这个问题作为一个例子留在这里。附件是解决这个问题的全部方法