使用python从音频文件中提取1/3倍频程_Python_Audio_Fft

使用python从音频文件中提取1/3倍频程

python audio

使用python从音频文件中提取1/3倍频程,python,audio,fft,Python,Audio,Fft,我是信号处理的初学者，我想在mp3或wav文件上应用三倍频程带通滤波器（产生大约30个新的滤波时间序列）中心频率：39赫兹，50赫兹，63赫兹，79赫兹，99赫兹，125赫兹，157赫兹，198赫兹，250赫兹，315赫兹，397赫兹，500赫兹第一条路在我读了mp3文件后，我得到了一个立体声信号。然后我将一个音频文件分割成4096个样本。然后我把它分成左声道和右声道。现在我有了每个通道的数据数组。接下来，我对一个示例文件应用快速傅立叶变换。问题是我需要对这些样本应用三倍频程带通滤波器。我

我是信号处理的初学者，我想在mp3或wav文件上应用三倍频程带通滤波器（产生大约30个新的滤波时间序列）中心频率：39赫兹，50赫兹，63赫兹，79赫兹，99赫兹，125赫兹，157赫兹，198赫兹，250赫兹，315赫兹，397赫兹，500赫兹

第一条路

在我读了mp3文件后，我得到了一个立体声信号。然后我将一个音频文件分割成4096个样本。然后我把它分成左声道和右声道。现在我有了每个通道的数据数组。接下来，我对一个示例文件应用快速傅立叶变换。问题是我需要对这些样本应用三倍频程带通滤波器。我需要建议我该怎么做，因为我不太了解声学图书馆

另一种方式

我找到了一些与我的期望相关的网站，但他使用倍频程带通滤波器。我使用了Michael在上的回复中的代码所以我想把这个代码应用到第三个八度音阶

from scipy import signal
import numpy as np
import matplotlib.pyplot as plt
import math

sampleRate = 44100.0
nyquistRate = sampleRate/2.0

#center = [39, 50, 63, 79, 99, 125, 157, 198, 250, 315, 397, 500, 630, 
794, 1000, 1260, 1588, 2000, 2520, 3176, 4000, 5040, 6352, 8000, 10080, 
12704, 16000, 20160, 2508, 32000]
centerFrequency_Hz = 480.0;
lowerCutoffFrequency_Hz=centerFrequency_Hz/math.sqrt(2);
upperCutoffFrequenc_Hz=centerFrequency_Hz*math.sqrt(2);

# Determine numerator (b) and denominator (a) coefficients of the digital 
# Infinite Impulse Response (IIR) filter.
b, a = signal.butter( N=4, Wn=np.array([ lowerCutoffFrequency_Hz, 
upperCutoffFrequenc_Hz])/nyquistRate, btype='bandpass', analog=False, 
output='ba');

# Compute frequency response of the filter.
w, h = signal.freqz(b, a)

fig = plt.figure()
plt.title('Digital filter frequency response')
ax1 = fig.add_subplot(111)

plt.plot(w, 20 * np.log10(abs(h)), 'b')
plt.ylabel('Amplitude [dB]', color='b')
plt.xlabel('Frequency [rad/sample]')

ax2 = ax1.twinx()
angles = np.unwrap(np.angle(h))
plt.plot(w, angles, 'g')
plt.ylabel('Angle (radians)', color='g')
plt.grid()
plt.axis('tight')
plt.show()

fs, speech = wavfile.read(filename='segmented/atb30.wav');
speech = speech[:, 0]
fig=plt.figure()
plt.title('Speech Signal')
plt.plot(speech)

filteredSpeech=signal.filtfilt(b, a, speech)
fig=plt.figure()
plt.title('480 Hz Octave-band Filtered Speech')
plt.plot(filteredSpeech)

根据公式（5）和（6），对于1/3倍频程，每个频带的低频和高频由下式给出：

factor = np.power(G, 1.0/6.0)
lowerCutoffFrequency_Hz=centerFrequency_Hz/factor;
upperCutoffFrequency_Hz=centerFrequency_Hz*factor;

其中，

为2（根据规定的base-2规则设计过滤器时），或

np.power（10，0.3）

（根据规定的base-10规则设计过滤器时）。在您的情况下，您提供的中心频率接近使用base-2规则获得的值，因此您还应

G=2

以保持一致

请注意，对于给定的中心频率阵列，一些较高频率的值将大于奈奎斯特频率（采样率的一半）。当试图设计具有相同频率的滤波器时，这些将相应地产生无效的上限归一化频率输入。为避免将中心频率阵列的值限制在~19644Hz以下：

centerFrequency_Hz = np.array([39, 50, 63, 79, 99, 125, 157, 198, 250, 315, 
397, 500, 630, 794, 1000, 1260, 1588, 2000, 2520, 3176, 4000, 5040, 6352, 8000, 10080, 
12704, 16000])

此外，可以一次处理一组低频和高频，因此您应该在低频和高频阵列上循环，以设计每个带通滤波器：

for lower,upper in zip(lowerCutoffFrequency_Hz, upperCutoffFrequency_Hz):
    # Determine numerator (b) and denominator (a) coefficients of the digital 
    # Infinite Impulse Response (IIR) filter.
    b, a = signal.butter( N=4, Wn=np.array([ lower, 
    upper])/nyquistRate, btype='bandpass', analog=False, 
    output='ba');

    # Compute frequency response of the filter.
    w, h = signal.freqz(b, a)

    plt.plot(w, 20 * np.log10(abs(h)), 'b')

    # Filter signal
    filteredSpeech = signal.filtfilt(b, a, speech)

这将为震级响应提供一个类似于以下的曲线图：

在这一点上，你可能会注意到一些不稳定的迹象。为避免此问题，您可以切换到

sos

表示：

for lower,upper in zip(lowerCutoffFrequency_Hz, upperCutoffFrequency_Hz):
    # Design filter
    sos = signal.butter( N=4, Wn=np.array([ lower, 
    upper])/nyquistRate, btype='bandpass', analog=False, 
    output='sos');

    # Compute frequency response of the filter.
    w, h = signal.sosfreqz(sos)

    plt.plot(w, 20 * np.log10(abs(h)), 'b')

    # Filter signal
    filteredSpeech = signal.sosfiltfilt(sos, speech)

我最近开发了一个函数，可以轻松执行倍频程和分数倍频程过滤，可在github上使用：

它使用SOS系数并执行下采样，以在低频时正确过滤。

非常感谢，这正是我所需要的。我得到了这样的震级响应，对吗？接下来，我需要计算每个过滤时间序列的RMS、pan和盒计数，我可以用哪个值来提取这些特征？我看不到你链接上的图片。对于RMS，应该像

np.sqrt（np.mean（np.power（filteredSpeed，2）））一样简单。

。对于其他功能，您可能希望将其表述为另一个问题，包括您试图使用它们的目的。哦，对不起。现在可以看到该链接。谢谢你的建议。反应看起来很好。