Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/326.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 多个不同长度序列上的Baum-Welch?_Python_Numpy_Hidden Markov Models - Fatal编程技术网

Python 多个不同长度序列上的Baum-Welch?

Python 多个不同长度序列上的Baum-Welch?,python,numpy,hidden-markov-models,Python,Numpy,Hidden Markov Models,我希望你们能帮我澄清一些事情,我很难把我学到的关于HMM和一般数据准备的知识联系起来 所以,我已经为室内绘制的角色创建了一个特征提取器。这些字符存储为x轴和y轴上从一毫秒到下一毫秒的位置,以及第三行b,表示是否单击了笔(鼠标) 离散特征的值介于0-48之间,取决于x轴和y轴的变化幅度。由于数据是如何创建的,这些观察的长度可能会有所不同 我可能很快画出一个T_1,然后很慢地画出第二个T_2。。。然后是len(T_1_功能)!=透镜(T_2_特征) 因此,当我们对多个序列进行Baum-Welch时,

我希望你们能帮我澄清一些事情,我很难把我学到的关于HMM和一般数据准备的知识联系起来

所以,我已经为室内绘制的角色创建了一个特征提取器。这些字符存储为x轴和y轴上从一毫秒到下一毫秒的位置,以及第三行b,表示是否单击了笔(鼠标)

离散特征的值介于0-48之间,取决于x轴和y轴的变化幅度。由于数据是如何创建的,这些观察的长度可能会有所不同

我可能很快画出一个T_1,然后很慢地画出第二个T_2。。。然后是len(T_1_功能)!=透镜(T_2_特征)

因此,当我们对多个序列进行Baum-Welch时,我们保留前向传递和后向传递的值,然后在重新估计状态转移和发射矩阵(以及初始prob)时,我们必须同时进行更新

但是。。。我该如何处理长度差异?我最初唯一的想法是将离散值移动到1-49之间,并用0填充较短的序列。。。但这会影响排放分布:(

我想我想知道的是

  • 我可以用不同长度的Baum Welch吗?如果可以的话,你能给我指出正确的方向吗?首先,我发现numpy不喜欢使用不同长度的嵌套数组
  • 如果不是的话,那么如何自发地修正特征提取,使特征长度相同呢
我不指望你能解决这个问题,我只是被难住了,希望你能给我一些新的想法,这些想法可能是我还没有想到的