Dataset 基于Apriori算法的超市数据集

Dataset 基于Apriori算法的超市数据集,dataset,integration-testing,data-mining,apriori,Dataset,Integration Testing,Data Mining,Apriori,“我必须开发一个软件,专门用于“未来商店”超市的业务分析师,该软件对超市销售交易的给定过渡数据执行关联规则挖掘,并通过准备Combo来准备折扣政策。 该软件使用了数据挖掘算法,即Apriori算法。关联规则将以用户友好的方式显示,以生成折扣 基于正关联规则的策略。” 我从哪里可以获得超市数据集来检查我编写的Apriori算法?您应该为每个单元测试设计一个小的、特定的数据集,而不是寻找真实的数据集。数据集应提供验证系统单个功能所需的最小前提条件。这将使它更容易检测错误,随着时间的推移维护测试,并向

“我必须开发一个软件,专门用于“未来商店”超市的业务分析师,该软件对超市销售交易的给定过渡数据执行关联规则挖掘,并通过准备Combo来准备折扣政策。 该软件使用了数据挖掘算法,即Apriori算法。关联规则将以用户友好的方式显示,以生成折扣 基于正关联规则的策略。”


我从哪里可以获得超市数据集来检查我编写的Apriori算法?

您应该为每个单元测试设计一个小的、特定的数据集,而不是寻找真实的数据集。数据集应提供验证系统单个功能所需的最小前提条件。这将使它更容易检测错误,随着时间的推移维护测试,并向其他开发人员演示系统的功能和使用模式

另一个域中的一个示例是对创建和验证网站登录的用户子系统进行测试

  • addsNewUser
    -空数据集
  • throwsExceptionForDuplicateUsername
    -单用户数据集
  • correctPasswordPass
    -相同的数据集
  • 通过不正确名称的例外处理
    -相同的数据集
  • 通过密码不正确的例外情况
    -相同的数据集
  • 当nWuser名称存在时通过异常
    -两个用户数据集
更新:如果您需要一个非常大的数据集来执行集成或性能测试,您可能需要编写一个程序来生成随机的购买集合。我怀疑现有的超市是否愿意(或能够)放弃他们的真实数据集


话虽如此,在多年前(HIPAA前)作为一家健康保险提供商的承包商工作时,我得到了一个样本数据集。它包含真实的患者信息,包括SSN和机密病历(

要获取市场数据集,您可以访问这里:fimi.ua.ac.be/data/并下载零售数据集

这是一个来自比利时商店的匿名交易数据集


它非常适合测试Apriori或其他频繁项集挖掘和关联规则挖掘算法。

我已经完成了所有单元测试,也在小数据集上进行了测试,现在我需要一个大数据来验证it@blackhole-根据我的更新,我怀疑您需要自己构建它。