Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/291.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python “利布罗萨生产”;“不详细”;MFCC谱图_Python_Conv Neural Network_Spectrogram_Librosa_Mfcc - Fatal编程技术网

Python “利布罗萨生产”;“不详细”;MFCC谱图

Python “利布罗萨生产”;“不详细”;MFCC谱图,python,conv-neural-network,spectrogram,librosa,mfcc,Python,Conv Neural Network,Spectrogram,Librosa,Mfcc,我正试图用librosa创建一个MFCC图,但该图似乎不太详细。目标是将此MFCC谱图呈现给神经网络。我正在测试的音频文件大约有1秒长,来自Google语音命令数据集。我的代码是: 窗口大小=20 NFFT=整数((窗口大小/1000)*16000) 样本量=librosa.load(f,sr=16000) mfccs=librosa.feature.mfcc(y=samples[:16000],sr=16000,n_fft=NFFT,n_mfcc=40) plt.图(figsize=(10,4

我正试图用librosa创建一个MFCC图,但该图似乎不太详细。目标是将此MFCC谱图呈现给神经网络。我正在测试的音频文件大约有1秒长,来自Google语音命令数据集。我的代码是:

窗口大小=20
NFFT=整数((窗口大小/1000)*16000)
样本量=librosa.load(f,sr=16000)
mfccs=librosa.feature.mfcc(y=samples[:16000],sr=16000,n_fft=NFFT,n_mfcc=40)
plt.图(figsize=(10,4))
librosa.display.specshow(mfccs,x_axis='time')
plt.colorbar()
产品名称(“MFCC”)
plt.紧_布局()
plt.show()
这是正在生成的MFCC光谱图:


第0个系数与其他系数相比具有更多的能量,因此其他波段的差异在图中显示得不是很好

您可能希望对此进行规格化,以便所有系数都在相同的比例上。您可以计算每个系数的平均值和标准偏差,然后通过减去平均值并除以标准偏差进行标准化。这可以在每个剪辑或整个训练集中完成。

可能有帮助:在使用
specshow
时指定采样率和跳数,否则会假定错误的值。