Speech recognition 如何从mfcc系数中提取特征

Speech recognition 如何从mfcc系数中提取特征,speech-recognition,feature-extraction,mfcc,Speech Recognition,Feature Extraction,Mfcc,我已经成功地提取了MFCC系数,并且得到了以下值 -15.2366 6.4996 -2.1807 0.2495 -1.3403 0.9815 -0.1106 1.7914 0.7311 1.1881 1.3340 2.6080 1.4208 2.0144 0.5085 -1.1236 -1.2728 -0.9470 -0.8139 0.8987 1

我已经成功地提取了MFCC系数,并且得到了以下值

  -15.2366
    6.4996
   -2.1807
    0.2495
   -1.3403
    0.9815
   -0.1106
    1.7914
    0.7311
    1.1881
    1.3340
    2.6080
    1.4208
    2.0144
    0.5085
   -1.1236
   -1.2728
   -0.9470
   -0.8139
    0.8987
    1.6006
    1.6000
    0.4638
    0.3747
    0.0670
   -0.0620
    0.6234
    0.0614
    0.0964
    0.2334
   -0.2188
    0.0591
    0.6765
    0.3943
   -0.1409
    0.1894
    0.0004
   -0.4762
   -0.1273
    0.1655
   -0.0649
   -0.2606
    0.0075
   -0.1275
   -0.2038
   -0.1332
    0.2084
    0.5128
    0.8877
    0.5406
现在,如何从这些值中提取特征。
谢谢

MFCC已经是训练识别引擎(通常是HMM)所必须使用的功能

但是,您是如何提取这些特征的? 我假设vector表示您正在处理的音频文件中单个100ms窗口的MFCC,因为典型的MFCC看起来像一个N-x-M矩阵。 N是用于提取特征的窗口数,M取决于提取MFCC的方式(通常M=39)