如何在python中使用KMeans对时间序列进行集群

如何在python中使用KMeans对时间序列进行集群,python,numpy,pandas,machine-learning,scikit-learn,Python,Numpy,Pandas,Machine Learning,Scikit Learn,因此,我有一个格式为[UID obj1 obj2..]x timestamp的数据,我想使用sklearn中的kmeans在python中对这些数据进行集群。我应该从哪里开始 编辑: 因此,基本上我正在尝试根据clickstream数据对用户进行聚类,并根据使用模式对其进行分类。您可以根据原始数据添加更多功能,并使用RFM分析等方法。RFM=最近、频率、货币 例如: 用户多久登录一次? 用户上次登录的时间?您可以使用Python库(),它允许您使用简单的命令根据clickstream数据对用户进

因此,我有一个格式为[UID obj1 obj2..]x timestamp的数据,我想使用sklearn中的kmeans在python中对这些数据进行集群。我应该从哪里开始

编辑:


因此,基本上我正在尝试根据clickstream数据对用户进行聚类,并根据使用模式对其进行分类。

您可以根据原始数据添加更多功能,并使用RFM分析等方法。RFM=最近、频率、货币

例如:

用户多久登录一次?


用户上次登录的时间?

您可以使用Python库(),它允许您使用简单的命令根据clickstream数据对用户进行集群。您还可以指定您对集群感兴趣的任何目标事件,并使用交互式图形浏览获得的图形

data.rete.get_clusters(method='kmeans',
                   feature_type='tfidf',
                   n_clusters=8,
                   ngram_range=(1,2),
                   plot_type='cluster_bar',
                   targets=['payment_done','cart']);

接下来,您可以使用交互式图形探索获得的行为群集:

clus_0 = data.rete.filter_cluster(0)
clus_0.rete.plot_graph(thresh=0.1,
                   weight_col='user_id',
                   targets = {'lost':'red',
                              'payment_done':'green'})

你能吗?你能举一个你想要实现的例子吗?重复的问题:sci工具包有很好的和其他集群算法的实现