Python 多维数据的TimeSeries K-means聚类_Python_Time Series_K Means

Python 多维数据的TimeSeries K-means聚类

python

Python 多维数据的TimeSeries K-means聚类,python,time-series,k-means,Python,Time Series,K Means,我正在使用Tslearn的TimeSeriesKmeans库将我的数据集与shape（3000300,8）进行聚类，但是文档中只讨论了数据集的维度为（n_样本，timesteps，1）即（单个特征）的情况。有人能帮我理解我是否能用更高的维度执行集群吗？我使用“DTW”作为我的距离度量。我使用了tslearn.clustering库中的TimeSeriesKMeans。正如您所提到的，tslearn文档中唯一可用的示例是使用一维输入。然而，处理高维时间序列数据是非常常见的。例如，在我的例子中，我

我正在使用Tslearn的TimeSeriesKmeans库将我的数据集与shape（3000300,8）进行聚类，但是文档中只讨论了数据集的维度为（n_样本，timesteps，1）即（单个特征）的情况。有人能帮我理解我是否能用更高的维度执行集群吗？

我使用“DTW”作为我的距离度量。

我使用了tslearn.clustering库中的TimeSeriesKMeans。正如您所提到的，tslearn文档中唯一可用的示例是使用一维输入。然而，处理高维时间序列数据是非常常见的。例如，在我的例子中，我对人体运动进行聚类，每个帧包含30帧135个关节关键点。因此，我的数据形状就像（样本的数量、帧的数量、特征）

为了使用TSLearn的Timeserieskmeans，您需要输入一个包含（n_样本、m_时间步长（序列长度）、k_特征（k_维度））的数据数组

如果查看fit函数，函数参数如下所示：

拟合（X，y=None）[来源]计算k-均值聚类

参数：X:shape=（n_ts，sz，d）时间序列的类似数组数据集

y忽略

关键是，您的输入数据应该是一个形状为（n_sample，seq_length，n_features）的数据数组，否则它将无法工作。例如，首先，我的数据类似于（n_样本）列表，该列表中的每个元素类似于（seq_长度，features）。直到我把它转换成一个带有（n_样本，seq_长度，特性）的数据数组，它才起作用