在Python中运行apriori_Python_Csv_Sparse Matrix_Arules

在Python中运行apriori

python csv

在Python中运行apriori,python,csv,sparse-matrix,arules,Python,Csv,Sparse Matrix,Arules,我是python的新手&尝试使用apriori算法运行关联规则。我已经广泛地使用R完成了这个操作。同样，我的工作流程是读取R中的csv文件（让df）使用“acast”创建稀疏/事务矩阵（acast（df，colA~colB））运行apriori函数选择有用的支撑提升和信心检查规则为了在python中运行arules，我在这里搜索并看到了我可以像在R中一样执行第三步。第二步我遇到了问题我所做的，搜索谷歌，是 import csv file = open('file path',"rb"

我是python的新手&尝试使用apriori算法运行关联规则。我已经广泛地使用R完成了这个操作。同样，我的工作流程是

读取R中的csv文件（让df）

使用“acast”创建稀疏/事务矩阵（

acast（df，colA~colB）

）

运行apriori函数选择有用的支撑提升和信心

检查规则

为了在python中运行arules，我在这里搜索并看到了我可以像在R中一样执行第三步。第二步我遇到了问题

我所做的，搜索谷歌，是

import csv
file = open('file path',"rb")
csvread = csv.reader(file,delimiter=';')

现在，从这个“csvread”中，我想选择两列，让“store location”和“item”，首先创建一个稀疏矩阵，就像我在R（acast）中所做的那样，然后我想运行apriori算法来检查规则

我已经浏览了几个链接，但找不到问题的确切解决方案。任何能解决我问题的建议都会非常有帮助。

我不是故意小气，但你说你“找不到问题的确切解决方案”，这不是你应该寻找的。您知道需要采取的基本步骤（如构建稀疏矩阵）。决定如何表示这些内容，并找出如何在python中完成这些较小的部分。然后把它们放在一起。如果您必须找到确切的解决方案，很遗憾，您不会走得很远。如果您在R中使用dataframes来实现这一点，为什么不在Python中也使用dataframes呢？Pandas提供了一个稀疏的数据结构：可能是“精确”一词用错了。但我试图一步一步地取得进步，而在第二步我就被卡住了。这很公平。我可能把“精确”这个词理解得太字面了。顺便说一句，我不是落选者。你看过了吗？