Java 语音识别中HMM的观测序列格式

Java 语音识别中HMM的观测序列格式,java,signal-processing,speech-recognition,hidden-markov-models,Java,Signal Processing,Speech Recognition,Hidden Markov Models,我正在尝试开发一个系统来分离语音识别中的垃圾和非垃圾。我正在使用隐马尔可夫模型的jahmm实现。我不知道我应该以何种形式将训练数据作为观察序列提供给系统。HMM中的每个状态由什么组成?我试着看手册,但看不懂。多谢各位 我不知道我应该以何种形式将训练数据作为观察序列提供给系统 要理解格式,只需阅读源代码即可 public <O extends Observation> Hmm<O> learn(Hmm<O> initialHmm, List<? e

我正在尝试开发一个系统来分离语音识别中的垃圾和非垃圾。我正在使用隐马尔可夫模型的jahmm实现。我不知道我应该以何种形式将训练数据作为观察序列提供给系统。HMM中的每个状态由什么组成?我试着看手册,但看不懂。多谢各位

我不知道我应该以何种形式将训练数据作为观察序列提供给系统

要理解格式,只需阅读源代码即可

public <O extends Observation> Hmm<O>
    learn(Hmm<O> initialHmm, List<? extends List<? extends O>> sequences)
public-Hmm

学习(嗯,非常感谢你的回复。我明白你的意思,我只是不知道如何在信号处理方面做到这一点,因为我是一名计算机科学学生。如果你有任何链接可以帮助我理解这一点,那就太好了。再次感谢你如果你想得到帮助,你需要花一些时间解释你需要什么。我没有你所说的“信号处理水平”是什么意思关于你问的原始问题。我是指语音信号,在获得MFCC后,我是否需要在将数据传递给HMM进行训练之前对其进行进一步转换?GMM是否与该过程有关?因为我不知道它们是什么。你可以使用MFCC进行训练,或者你可以向MFCC添加增量特征以获得更好的准确性.Google可以告诉你什么是delta特征。GMM与这个过程无关,尽管你应该更好地研究它们。所以,如果我没弄错的话,它只是作为一个观察向量序列列表传递的MFCC?