Python “利布罗萨生产”；“不详细”；MFCC谱图_Python_Conv Neural Network_Spectrogram_Librosa_Mfcc

Python “利布罗萨生产”；“不详细”；MFCC谱图

python

Python “利布罗萨生产”；“不详细”；MFCC谱图,python,conv-neural-network,spectrogram,librosa,mfcc,Python,Conv Neural Network,Spectrogram,Librosa,Mfcc,我正试图用librosa创建一个MFCC图，但该图似乎不太详细。目标是将此MFCC谱图呈现给神经网络。我正在测试的音频文件大约有1秒长，来自Google语音命令数据集。我的代码是：窗口大小=20 NFFT=整数（（窗口大小/1000）*16000）样本量=librosa.load（f，sr=16000） mfccs=librosa.feature.mfcc（y=samples[：16000]，sr=16000，n_fft=NFFT，n_mfcc=40） plt.图（figsize=（10,4

我正试图用librosa创建一个MFCC图，但该图似乎不太详细。目标是将此MFCC谱图呈现给神经网络。我正在测试的音频文件大约有1秒长，来自Google语音命令数据集。我的代码是：

窗口大小=20
NFFT=整数（（窗口大小/1000）*16000）
样本量=librosa.load（f，sr=16000）
mfccs=librosa.feature.mfcc（y=samples[：16000]，sr=16000，n_fft=NFFT，n_mfcc=40）
plt.图（figsize=（10,4））
librosa.display.specshow（mfccs，x_axis='time'）
plt.colorbar（）
产品名称（“MFCC”）
plt.紧_布局（）
plt.show（）

这是正在生成的MFCC光谱图：

第0个系数与其他系数相比具有更多的能量，因此其他波段的差异在图中显示得不是很好

您可能希望对此进行规格化，以便所有系数都在相同的比例上。您可以计算每个系数的平均值和标准偏差，然后通过减去平均值并除以标准偏差进行标准化。这可以在每个剪辑或整个训练集中完成。

可能有帮助：在使用

specshow

时指定采样率和跳数，否则会假定错误的值。