Machine learning Ta Feng杂货店数据集的下载链接

Machine learning Ta Feng杂货店数据集的下载链接,machine-learning,dataset,data-mining,Machine Learning,Dataset,Data Mining,几天来,我拼命想下载Ta Feng杂货店的数据集,但似乎所有链接都断了。我需要为我的硕士论文进行数据挖掘/机器学习研究。我还有微软的杂货店数据库,来自Weka的比利时商店和超市.arff。然而在这项研究中,他们说塔峰是所有公共数据集中最大、最有趣的 我将非常感谢任何帮助:)干杯 投了反对票的人不明白,要找到这条与超市场景相关的机器学习信息有多么困难。这是最大的公开数据集,包含4个月的大丰超市购物交易。我是从春南教授那里得到的,他非常好心地把它寄给我,因为他以前在台湾的研究所的服务器不再支持它了

几天来,我拼命想下载Ta Feng杂货店的数据集,但似乎所有链接都断了。我需要为我的硕士论文进行数据挖掘/机器学习研究。我还有微软的杂货店数据库,来自Weka的比利时商店和超市.arff。然而在这项研究中,他们说塔峰是所有公共数据集中最大、最有趣的


我将非常感谢任何帮助:)干杯

投了反对票的人不明白,要找到这条与超市场景相关的机器学习信息有多么困难。这是最大的公开数据集,包含4个月的大丰超市购物交易。我是从春南教授那里得到的,他非常好心地把它寄给我,因为他以前在台湾的研究所的服务器不再支持它了。这里有一个供所有需要它的人使用的链接:

如果任何人使用这个“Ta Feng”数据集,在列名方面都会遇到重大问题。所以我想分享这个。希望这将极大地帮助某人

它包含这些文件

D11:2000年11月收集的交易数据

D12:2000年12月收集的交易数据

D01:2001年1月收集的交易数据

D02:2001年2月收集的交易数据

交易数据的格式

第一行:繁体中文中的列定义

第二行和其他行:数据列由“;”分隔

列定义

交易日期和时间(时间无效和无用)

客户ID

年龄:10个可能值

65岁

居住区:8个可能值,A-F:zipcode区域:105106110114115221,G:其他,H:存储未知距离,从最近的:1152211114105106110

产品子类

产品ID

数量

资产


销售价格

dropbox链接似乎已断开。您仍然可以通过以下链接下载数据集:


我还添加了小的ruby脚本,将文件转换为WEKA readable.arff文件以及文件本身亲爱的Dragan,首先,非常感谢,这是非常有价值的信息。我试图理解数据,理解每个字段的含义,但如果我在文本编辑器上打开它,我可以看到数据本身,但看不到标题。。。您是否也有这些信息?谢谢!这真的很有帮助,谢谢你。我很高兴听到你这么说。干杯@查尔斯州