在Python中运行apriori

在Python中运行apriori,python,csv,sparse-matrix,arules,Python,Csv,Sparse Matrix,Arules,我是python的新手&尝试使用apriori算法运行关联规则。我已经广泛地使用R完成了这个操作。同样,我的工作流程是 读取R中的csv文件(让df) 使用“acast”创建稀疏/事务矩阵(acast(df,colA~colB)) 运行apriori函数选择有用的支撑提升和信心 检查规则 为了在python中运行arules,我在这里搜索并看到了我可以像在R中一样执行第三步。第二步我遇到了问题 我所做的,搜索谷歌,是 import csv file = open('file path',"rb"

我是python的新手&尝试使用apriori算法运行关联规则。我已经广泛地使用R完成了这个操作。同样,我的工作流程是

  • 读取R中的csv文件(让df)
  • 使用“acast”创建稀疏/事务矩阵(
    acast(df,colA~colB)
  • 运行apriori函数选择有用的支撑提升和信心
  • 检查规则
  • 为了在python中运行arules,我在这里搜索并看到了我可以像在R中一样执行第三步。第二步我遇到了问题

    我所做的,搜索谷歌,是

    import csv
    file = open('file path',"rb")
    csvread = csv.reader(file,delimiter=';')
    
    现在,从这个“csvread”中,我想选择两列,让“store location”和“item”,首先创建一个稀疏矩阵,就像我在R(acast)中所做的那样,然后我想运行apriori算法来检查规则


    我已经浏览了几个链接,但找不到问题的确切解决方案。任何能解决我问题的建议都会非常有帮助。

    我不是故意小气,但你说你“找不到问题的确切解决方案”,这不是你应该寻找的。您知道需要采取的基本步骤(如构建稀疏矩阵)。决定如何表示这些内容,并找出如何在python中完成这些较小的部分。然后把它们放在一起。如果您必须找到确切的解决方案,很遗憾,您不会走得很远。如果您在R中使用dataframes来实现这一点,为什么不在Python中也使用dataframes呢?Pandas提供了一个稀疏的数据结构:可能是“精确”一词用错了。但我试图一步一步地取得进步,而在第二步我就被卡住了。这很公平。我可能把“精确”这个词理解得太字面了。顺便说一句,我不是落选者。你看过了吗?