Python Librosa地块澄清

Python Librosa地块澄清,python,machine-learning,deep-learning,voice-recognition,librosa,Python,Machine Learning,Deep Learning,Voice Recognition,Librosa,我用librosa处理音频文件 “good.wav”是一个30秒的音频文件 该守则— data, sampling_rate = librosa.load('good.wav', ) plt.figure(figsize=(12, 4)) librosa.display.waveplot(data, sr=sampling_rate) 这里,采样率=22050 上述代码将生成正确的绘图。 然后,我将采样率(频率)更改为60000 plt.figure(figsize=(12, 4)) lib

我用librosa处理音频文件

“good.wav”是一个30秒的音频文件

该守则—

data, sampling_rate = librosa.load('good.wav', )
plt.figure(figsize=(12, 4))
librosa.display.waveplot(data, sr=sampling_rate)
这里,采样率=22050

上述代码将生成正确的绘图。

然后,我将采样率(频率)更改为60000

plt.figure(figsize=(12, 4))
librosa.display.waveplot(data, sr = 60000)
此代码导致此绘图:

上述代码与事实相符,频率=1/次,频率增加时时间缩短

之后,我对音频进行了重新采样

samples = librosa.core.resample(data, sampling_rate, 60000)
它给出的“samples”变量的值比“data”变量的值高。 实际上,len(数据)=600000,len(样本)=1800000

然后,我想绘制“样本”值-

其结果如下所示:

但在这个情节中,时间是稳定的。 当频率增加到60000时,为什么不缩短时间


谢谢你

。。。您将其重新采样到60000,因此现在它的采样率为60000。因此,绘图将显示采样率为60000的正确长度。我认为,我理解正确。如果我不对,让我纠正一下。这个代码-librosa.display.waveplot(数据,sr=60000),“sr”使音频收缩。因此,音频从30秒缩短到11秒。在这种情况下,“sr”意味着频率。另外一个澄清——采样率和频率是否相同。因为“sr”在librosa.display函数中表现为频率,在resample()函数中也表现为每秒从信号中获取的采样值的数量。。。。您将其重新采样到60000,因此现在它的采样率为60000。因此,绘图将显示采样率为60000的正确长度。我认为,我理解正确。如果我不对,让我纠正一下。这个代码-librosa.display.waveplot(数据,sr=60000),“sr”使音频收缩。因此,音频从30秒缩短到11秒。在这种情况下,“sr”意味着频率。另外一个澄清——采样率和频率是否相同。因为“sr”在librosa.display函数中表现为频率,在resample()函数中也表现为每秒从信号中获取的采样值数。
plt.figure(figsize=(12, 4))
librosa.display.waveplot(samples, sr = 60000)