Machine learning 根据标记的数据查找要拆分n维时间序列的点_Machine Learning_Time Series_Feature Extraction

Machine learning 根据标记的数据查找要拆分n维时间序列的点

machine-learning

Machine learning 根据标记的数据查找要拆分n维时间序列的点,machine-learning,time-series,feature-extraction,Machine Learning,Time Series,Feature Extraction,我正处于一个更大项目的起点，该项目旨在确定时间序列中的常见模式。目标是在时间序列中自动找到分割点，从而将序列分割为常用模式。（稍后我想基于分割点分割时间序列，以便在两者之间独立使用时间序列。）一个时间序列包括： n基于固定时间间隔作为输入的数据系列 x轴表示从0到m的区间指数 y轴表示特定时间序列的值例如，它可以如下所示： pos_x,pos_y,pos_z,force_x,force_y,force_z,speed,is_split_point 2, 3, 4, 0

我正处于一个更大项目的起点，该项目旨在确定时间序列中的常见模式。 目标是在时间序列中自动找到分割点，从而将序列分割为常用模式。（稍后我想基于分割点分割时间序列，以便在两者之间独立使用时间序列。）

一个时间序列包括：

n基于固定时间间隔作为输入的数据系列
x轴表示从0到m的区间指数
y轴表示特定时间序列的值

例如，它可以如下所示：

pos_x,pos_y,pos_z,force_x,force_y,force_z,speed,is_split_point
 2,     3,    4,  0.4232, 0.4432,    0,     0.6, false
 2,     3,    4,  0.4232, 0.4432,    0,     0.6, false
 2,     3,    4,  0.4232, 0.4432,    0,     0.6, true

我最好的办法是用机器学习来解决这个问题，因为我需要一种通用的方法来检测基于用户选择的模式。因此，我有很多标记数据，其中分割点已经由用户手动设置

目前，我有两个想法来解决这个问题：

分析标记数据中分割点周围的数据，得出不同数据维度之间的相关性，并将其用作未标记数据的新特征

分析两个关键帧之间的模式以在未标记的数据中找到相似的模式我喜欢1。因为我认为更重要的是找出什么定义了分割点。我很好奇神经元网络是否适合这个任务

我问这个问题不是为了解决这个问题，我只是想得到第二种意见。我对机器学习比较陌生，这就是为什么要为这个问题找到一个好的起点有点困难。我很高兴有任何可以解决这个问题的想法、技术和有用的资源，可以给我一个很好的起点。

哇，这是一个很好的问题。事实上，我也有一些想法要告诉你们，其中一些想法已经过测试，并针对我遇到的异常事件处理了不同的基于时间的问题

首先，无论您将使用何种解决方案，分析数据始终是更好地理解问题的一种好方法。通过这种方式，您可以确保不会给您的模型提供垃圾。用于此分析的工具可以是截断的过去窗口中的峰值、导数等

然后，您可以使用绘制数据，并查看数据中是否存在某种分离

然而，简单地使用神经网络可能会有问题，因为你有少量的分裂点和大量的非分裂点。您可以使用LSTM，并在多对一配置中对其进行培训，从而创建数量平衡的正面和负面示例。LSTM将帮助您克服示例长度的变化，并赋予时域更多含义

在这个方向上，您可以使用截断的过去，并以

is_split_point

为标签作为示例，通过以平衡的方式提取样本来使用i.i.d模型。DNNS也在该配置中工作

以上都是我发现有用的实验方法。

我希望有帮助。祝你好运

非常感谢你的回答。我认为这是一个很好的开始。t-sne看起来很有前途。我将继续编写材料并再次回信。我正试图用Keras构建一个LSTM模型。你有什么建议吗<代码>模型.add（LSTM（100，输入形状=（无，输入尺寸））

model.add（稠密（1，激活='sigmoid'））

model.compile（loss='binary'u crossentropy'，optimizer='adam'，metrics=['accurity']）