Python 3.x 如何使用python将长音频(例如:1小时)文件拆分为多个短长度(5秒)音频文件
我有一些长音频文件。我想使用python将此音频文件拆分为多个短长度音频文件。例如:音频长长度超过1小时,希望拆分为多个短长度音频文件。我想在每个5s中提取整个音频文件的功能。您的问题中有两个问题Python 3.x 如何使用python将长音频(例如:1小时)文件拆分为多个短长度(5秒)音频文件,python-3.x,audio,Python 3.x,Audio,我有一些长音频文件。我想使用python将此音频文件拆分为多个短长度音频文件。例如:音频长长度超过1小时,希望拆分为多个短长度音频文件。我想在每个5s中提取整个音频文件的功能。您的问题中有两个问题 分割音频 提取特征 它们都有相同的基本关键信息:采样频率 音频信号的持续时间(以秒为单位)和用于音频文件的采样频率定义了音频文件的采样量。音频样本(简而言之)是硬盘或计算机内存中音频信号的一个值 典型wav文件的音频采样量根据公式sr*dur计算,此处sr是以Hz为单位的采样频率(例如,CD质量信号为
sr*dur
计算,此处sr
是以Hz为单位的采样频率(例如,CD质量信号为44100),dur
是音频文件的持续时间(以秒为单位)。例如,2秒的CD音频文件具有44100*2=88200
样本
因此:
要在Python中分割音频文件,首先必须在变量中读取它。例如,有很多库和函数(以随机顺序排列):
scipy.io.wavfile.read
模块wave
my\u audio\u 1=整个\u audio\u文件[0:5*sr]
但是强>
如果您只想每X秒提取一次功能,则无需手动分割音频。大多数音频特征提取库都可以为您这样做
例如,在
librosa
中,您可以控制FFT点的数量,这大致相当于要从中提取特征的音频长度。例如,您可以在此处查看:您可以查看下面的链接以获取所需内容。。