Python “利布罗萨生产”;“不详细”;MFCC谱图
我正试图用librosa创建一个MFCC图,但该图似乎不太详细。目标是将此MFCC谱图呈现给神经网络。我正在测试的音频文件大约有1秒长,来自Google语音命令数据集。我的代码是:Python “利布罗萨生产”;“不详细”;MFCC谱图,python,conv-neural-network,spectrogram,librosa,mfcc,Python,Conv Neural Network,Spectrogram,Librosa,Mfcc,我正试图用librosa创建一个MFCC图,但该图似乎不太详细。目标是将此MFCC谱图呈现给神经网络。我正在测试的音频文件大约有1秒长,来自Google语音命令数据集。我的代码是: 窗口大小=20 NFFT=整数((窗口大小/1000)*16000) 样本量=librosa.load(f,sr=16000) mfccs=librosa.feature.mfcc(y=samples[:16000],sr=16000,n_fft=NFFT,n_mfcc=40) plt.图(figsize=(10,4
窗口大小=20
NFFT=整数((窗口大小/1000)*16000)
样本量=librosa.load(f,sr=16000)
mfccs=librosa.feature.mfcc(y=samples[:16000],sr=16000,n_fft=NFFT,n_mfcc=40)
plt.图(figsize=(10,4))
librosa.display.specshow(mfccs,x_axis='time')
plt.colorbar()
产品名称(“MFCC”)
plt.紧_布局()
plt.show()
这是正在生成的MFCC光谱图:
第0个系数与其他系数相比具有更多的能量,因此其他波段的差异在图中显示得不是很好 您可能希望对此进行规格化,以便所有系数都在相同的比例上。您可以计算每个系数的平均值和标准偏差,然后通过减去平均值并除以标准偏差进行标准化。这可以在每个剪辑或整个训练集中完成。可能有帮助:在使用
specshow
时指定采样率和跳数,否则会假定错误的值。