Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/algorithm/10.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/flutter/9.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Algorithm 动态时间扭曲-比较值_Algorithm_Signal Processing_Speech_Mfcc - Fatal编程技术网

Algorithm 动态时间扭曲-比较值

Algorithm 动态时间扭曲-比较值,algorithm,signal-processing,speech,mfcc,Algorithm,Signal Processing,Speech,Mfcc,如果这是在错误的论坛道歉 好的,我试着比较两种不同的语音信号,我遇到了一个问题。下面是: 我已经将信号分割成块,并计算了每个块的MFCC系数。然后,我使用DTW算法将(输入的)信号与训练信号进行比较 编辑(这个算法有效吗) 我已经更新了算法(从维基百科的文章中写到): 它现在处理二维向量,而不是一维向量。。我想这就是我出错的地方,因为它打印出了一系列的数字,而不仅仅是1 如果(实际、培训)MFCC的输入值完全相同,则差异为“0”,没有差异。我需要检查一个训练值,但是,这个算法看起来正确吗?您似乎

如果这是在错误的论坛道歉

好的,我试着比较两种不同的语音信号,我遇到了一个问题。下面是:

我已经将信号分割成块,并计算了每个块的MFCC系数。然后,我使用DTW算法将(输入的)信号与训练信号进行比较

编辑(这个算法有效吗)

我已经更新了算法(从维基百科的文章中写到):

它现在处理二维向量,而不是一维向量。。我想这就是我出错的地方,因为它打印出了一系列的数字,而不仅仅是1


如果(实际、培训)MFCC的输入值完全相同,则差异为“0”,没有差异。我需要检查一个训练值,但是,这个算法看起来正确吗?

您似乎不了解这个算法,可能需要阅读更多关于它的内容。作为MFCC计算的结果,您应该具有二维数组或帧序列。您应该使用欧几里德距离来计算帧之间的距离。您应该使用DTW来比较帧序列。@NikolayShmyrev感谢您的回答:)是的,通过计算MFCC,我有一个包含13个值的2D数组(每个块)。。因此,我是否需要计算欧几里德距离,然后计算DTW?我对此感到困惑。感谢DTW使用了距离函数。这种距离函数应该计算帧之间的欧几里德距离。为了避免混淆,请阅读@NikolayShmyrev上关于DTW的文章,请参阅我的最新文章,我对其进行了编辑以显示算法。。这看起来正确吗?还有,我还需要实现什么吗?算法似乎遵循您提供的链接。每个教程和论文都是正确的,而您不是。您需要传递两个向量:实际值[0]、实际值[1]等等。你不明白的是,实际[0]本身就是一个向量{28.6696,65.8777,44.2725,31.6083,42.6541,38.4104,26.6311,34.9188,37.2065,25.2479,41.5969,54.2681,37.0685,26.207},所以实际是向量的向量,实际[0]是13个系数的向量