Machine learning 根据标记的数据查找要拆分n维时间序列的点

Machine learning 根据标记的数据查找要拆分n维时间序列的点,machine-learning,time-series,feature-extraction,Machine Learning,Time Series,Feature Extraction,我正处于一个更大项目的起点,该项目旨在确定时间序列中的常见模式。 目标是在时间序列中自动找到分割点,从而将序列分割为常用模式。(稍后我想基于分割点分割时间序列,以便在两者之间独立使用时间序列。) 一个时间序列包括: n基于固定时间间隔作为输入的数据系列 x轴表示从0到m的区间指数 y轴表示特定时间序列的值 例如,它可以如下所示: pos_x,pos_y,pos_z,force_x,force_y,force_z,speed,is_split_point 2, 3, 4, 0

我正处于一个更大项目的起点,该项目旨在确定时间序列中的常见模式。 目标是在时间序列中自动找到分割点,从而将序列分割为常用模式。(稍后我想基于分割点分割时间序列,以便在两者之间独立使用时间序列。)

一个时间序列包括:

  • n基于固定时间间隔作为输入的数据系列
  • x轴表示从0到m的区间指数
  • y轴表示特定时间序列的值
例如,它可以如下所示:

pos_x,pos_y,pos_z,force_x,force_y,force_z,speed,is_split_point
 2,     3,    4,  0.4232, 0.4432,    0,     0.6, false
 2,     3,    4,  0.4232, 0.4432,    0,     0.6, false
 2,     3,    4,  0.4232, 0.4432,    0,     0.6, true
我最好的办法是用机器学习来解决这个问题,因为我需要一种通用的方法来检测基于用户选择的模式。 因此,我有很多标记数据,其中分割点已经由用户手动设置

目前,我有两个想法来解决这个问题:

  • 分析标记数据中分割点周围的数据,得出不同数据维度之间的相关性,并将其用作未标记数据的新特征
  • 分析两个关键帧之间的模式以在未标记的数据中找到相似的模式 我喜欢1。因为我认为更重要的是找出什么定义了分割点。 我很好奇神经元网络是否适合这个任务


    我问这个问题不是为了解决这个问题,我只是想得到第二种意见。我对机器学习比较陌生,这就是为什么要为这个问题找到一个好的起点有点困难。我很高兴有任何可以解决这个问题的想法、技术和有用的资源,可以给我一个很好的起点。

    哇,这是一个很好的问题。 事实上,我也有一些想法要告诉你们,其中一些想法已经过测试,并针对我遇到的异常事件处理了不同的基于时间的问题

    首先,无论您将使用何种解决方案,分析数据始终是更好地理解问题的一种好方法。通过这种方式,您可以确保不会给您的模型提供垃圾。用于此分析的工具可以是截断的过去窗口中的峰值、导数等

    然后,您可以使用绘制数据,并查看数据中是否存在某种分离

    然而,简单地使用神经网络可能会有问题,因为你有少量的分裂点和大量的非分裂点。 您可以使用LSTM,并在多对一配置中对其进行培训,从而创建数量平衡的正面和负面示例。LSTM将帮助您克服示例长度的变化,并赋予时域更多含义

    在这个方向上,您可以使用截断的过去,并以
    is_split_point
    为标签作为示例,通过以平衡的方式提取样本来使用i.i.d模型。DNNS也在该配置中工作

    以上都是我发现有用的实验方法。
    我希望有帮助。祝你好运

    非常感谢你的回答。我认为这是一个很好的开始。t-sne看起来很有前途。我将继续编写材料并再次回信。我正试图用Keras构建一个LSTM模型。你有什么建议吗<代码>模型.add(LSTM(100,输入形状=(无,输入尺寸))
    model.add(稠密(1,激活='sigmoid'))
    model.compile(loss='binary'u crossentropy',optimizer='adam',metrics=['accurity'])