Python Librosa地块澄清_Python_Machine Learning_Deep Learning_Voice Recognition_Librosa

Python Librosa地块澄清

python machine-learning deep-learning

Python Librosa地块澄清,python,machine-learning,deep-learning,voice-recognition,librosa,Python,Machine Learning,Deep Learning,Voice Recognition,Librosa,我用librosa处理音频文件 “good.wav”是一个30秒的音频文件该守则— data, sampling_rate = librosa.load('good.wav', ) plt.figure(figsize=(12, 4)) librosa.display.waveplot(data, sr=sampling_rate) 这里，采样率=22050 上述代码将生成正确的绘图。然后，我将采样率（频率）更改为60000 plt.figure(figsize=(12, 4)) lib

我用librosa处理音频文件

“good.wav”是一个30秒的音频文件

该守则—

data, sampling_rate = librosa.load('good.wav', )
plt.figure(figsize=(12, 4))
librosa.display.waveplot(data, sr=sampling_rate)

这里，采样率=22050

上述代码将生成正确的绘图。

然后，我将采样率（频率）更改为60000

plt.figure(figsize=(12, 4))
librosa.display.waveplot(data, sr = 60000)

此代码导致此绘图：

上述代码与事实相符，频率=1/次，频率增加时时间缩短

之后，我对音频进行了重新采样

samples = librosa.core.resample(data, sampling_rate, 60000)

它给出的“samples”变量的值比“data”变量的值高。实际上，len（数据）=600000，len（样本）=1800000

然后，我想绘制“样本”值-

其结果如下所示：

但在这个情节中，时间是稳定的。当频率增加到60000时，为什么不缩短时间

谢谢你

。。。您将其重新采样到60000，因此现在它的采样率为60000。因此，绘图将显示采样率为60000的正确长度。我认为，我理解正确。如果我不对，让我纠正一下。这个代码-librosa.display.waveplot（数据，sr=60000），“sr”使音频收缩。因此，音频从30秒缩短到11秒。在这种情况下，“sr”意味着频率。另外一个澄清——采样率和频率是否相同。因为“sr”在librosa.display函数中表现为频率，在resample（）函数中也表现为每秒从信号中获取的采样值的数量。。。。您将其重新采样到60000，因此现在它的采样率为60000。因此，绘图将显示采样率为60000的正确长度。我认为，我理解正确。如果我不对，让我纠正一下。这个代码-librosa.display.waveplot（数据，sr=60000），“sr”使音频收缩。因此，音频从30秒缩短到11秒。在这种情况下，“sr”意味着频率。另外一个澄清——采样率和频率是否相同。因为“sr”在librosa.display函数中表现为频率，在resample（）函数中也表现为每秒从信号中获取的采样值数。

plt.figure(figsize=(12, 4))
librosa.display.waveplot(samples, sr = 60000)