如何在python中使用KMeans对时间序列进行集群
因此,我有一个格式为[UID obj1 obj2..]x timestamp的数据,我想使用sklearn中的kmeans在python中对这些数据进行集群。我应该从哪里开始 编辑:如何在python中使用KMeans对时间序列进行集群,python,numpy,pandas,machine-learning,scikit-learn,Python,Numpy,Pandas,Machine Learning,Scikit Learn,因此,我有一个格式为[UID obj1 obj2..]x timestamp的数据,我想使用sklearn中的kmeans在python中对这些数据进行集群。我应该从哪里开始 编辑: 因此,基本上我正在尝试根据clickstream数据对用户进行聚类,并根据使用模式对其进行分类。您可以根据原始数据添加更多功能,并使用RFM分析等方法。RFM=最近、频率、货币 例如: 用户多久登录一次? 用户上次登录的时间?您可以使用Python库(),它允许您使用简单的命令根据clickstream数据对用户进
因此,基本上我正在尝试根据clickstream数据对用户进行聚类,并根据使用模式对其进行分类。您可以根据原始数据添加更多功能,并使用RFM分析等方法。RFM=最近、频率、货币 例如:
用户多久登录一次?
用户上次登录的时间?
您可以使用Python库(),它允许您使用简单的命令根据clickstream数据对用户进行集群。您还可以指定您对集群感兴趣的任何目标事件,并使用交互式图形浏览获得的图形
data.rete.get_clusters(method='kmeans',
feature_type='tfidf',
n_clusters=8,
ngram_range=(1,2),
plot_type='cluster_bar',
targets=['payment_done','cart']);
接下来,您可以使用交互式图形探索获得的行为群集:
clus_0 = data.rete.filter_cluster(0)
clus_0.rete.plot_graph(thresh=0.1,
weight_col='user_id',
targets = {'lost':'red',
'payment_done':'green'})
你能吗?你能举一个你想要实现的例子吗?重复的问题:sci工具包有很好的和其他集群算法的实现