Machine learning Ta Feng杂货店数据集的下载链接
几天来,我拼命想下载Ta Feng杂货店的数据集,但似乎所有链接都断了。我需要为我的硕士论文进行数据挖掘/机器学习研究。我还有微软的杂货店数据库,来自Weka的比利时商店和超市.arff。然而在这项研究中,他们说塔峰是所有公共数据集中最大、最有趣的Machine learning Ta Feng杂货店数据集的下载链接,machine-learning,dataset,data-mining,Machine Learning,Dataset,Data Mining,几天来,我拼命想下载Ta Feng杂货店的数据集,但似乎所有链接都断了。我需要为我的硕士论文进行数据挖掘/机器学习研究。我还有微软的杂货店数据库,来自Weka的比利时商店和超市.arff。然而在这项研究中,他们说塔峰是所有公共数据集中最大、最有趣的 我将非常感谢任何帮助:)干杯 投了反对票的人不明白,要找到这条与超市场景相关的机器学习信息有多么困难。这是最大的公开数据集,包含4个月的大丰超市购物交易。我是从春南教授那里得到的,他非常好心地把它寄给我,因为他以前在台湾的研究所的服务器不再支持它了
我将非常感谢任何帮助:)干杯 投了反对票的人不明白,要找到这条与超市场景相关的机器学习信息有多么困难。这是最大的公开数据集,包含4个月的大丰超市购物交易。我是从春南教授那里得到的,他非常好心地把它寄给我,因为他以前在台湾的研究所的服务器不再支持它了。这里有一个供所有需要它的人使用的链接:如果任何人使用这个“Ta Feng”数据集,在列名方面都会遇到重大问题。所以我想分享这个。希望这将极大地帮助某人 它包含这些文件 D11:2000年11月收集的交易数据 D12:2000年12月收集的交易数据 D01:2001年1月收集的交易数据 D02:2001年2月收集的交易数据 交易数据的格式 第一行:繁体中文中的列定义 第二行和其他行:数据列由“;”分隔 列定义 交易日期和时间(时间无效和无用) 客户ID 年龄:10个可能值 65岁 居住区:8个可能值,A-F:zipcode区域:105106110114115221,G:其他,H:存储未知距离,从最近的:1152211114105106110 产品子类 产品ID 数量 资产
销售价格dropbox链接似乎已断开。您仍然可以通过以下链接下载数据集:
我还添加了小的ruby脚本,将文件转换为WEKA readable.arff文件以及文件本身亲爱的Dragan,首先,非常感谢,这是非常有价值的信息。我试图理解数据,理解每个字段的含义,但如果我在文本编辑器上打开它,我可以看到数据本身,但看不到标题。。。您是否也有这些信息?谢谢!这真的很有帮助,谢谢你。我很高兴听到你这么说。干杯@查尔斯州