Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/297.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/logging/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/design-patterns/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 基于购物篮对客户进行聚类_Python_Cluster Analysis - Fatal编程技术网

Python 基于购物篮对客户进行聚类

Python 基于购物篮对客户进行聚类,python,cluster-analysis,Python,Cluster Analysis,我想根据客户的历史购物篮对其进行分类 我有以下矩阵描述每个用户及其相应的购买产品数量。例如,用户1购买了产品A的0、产品B的5和产品C的6 用户ID、产品A、产品B、产品C 1,0,5,6 2,1,4,5 3,9,1,0 我想做的是: 根据客户购买的产品(客户1和客户2)对客户进行分类 非常相似,因为他们都购买了大量的产品B和 产品C,而客户3更关注产品A) 可视化集群 问题: 我有大约20万客户 我有大约50000种产品(这些产品可以组合成 示例类别->仍将超过150个类别/a.k.a

我想根据客户的历史购物篮对其进行分类

我有以下矩阵描述每个用户及其相应的购买产品数量。例如,用户1购买了产品A的0、产品B的5和产品C的6

用户ID、产品A、产品B、产品C
1,0,5,6
2,1,4,5
3,9,1,0

我想做的是:

  • 根据客户购买的产品(客户1和客户2)对客户进行分类 非常相似,因为他们都购买了大量的产品B和 产品C,而客户3更关注产品A)

  • 可视化集群

问题:

  • 我有大约20万客户
  • 我有大约50000种产品(这些产品可以组合成 示例类别->仍将超过150个类别/a.k.a 尺寸

在Python中有没有什么推荐的方法来做这些事情?

您可能需要研究模式挖掘,特别是项集挖掘

可以让您开始的示例项目:

可以查看
scikit
。或者“python cluster是一个“简单”的软件包,允许从列表中创建多个对象组(集群)”谢谢你的建议,但我认为这不是我想要的。据我所知,我需要一个函数,根据每个客户购买的产品来计算他们之间的相似性。itemset模式挖掘可以让你确定人们一起购买的产品以及最常见的购买顺序,这样你就可以预测t下一步可能会有人购买。如果你只关注集群,scikit learn集群功能非常简单,但问题是为它提供一个一致的数据集(即每个用户的固定产品数量)你可以设置一个最大值,并在最大值下用空格填写。我理解你的观点,这是真的。但是,这种分类不应该用于预测,而是我向推荐引擎发展的一部分。