Python 3.x 如何使用python将长音频(例如:1小时)文件拆分为多个短长度(5秒)音频文件

Python 3.x 如何使用python将长音频(例如:1小时)文件拆分为多个短长度(5秒)音频文件,python-3.x,audio,Python 3.x,Audio,我有一些长音频文件。我想使用python将此音频文件拆分为多个短长度音频文件。例如:音频长长度超过1小时,希望拆分为多个短长度音频文件。我想在每个5s中提取整个音频文件的功能。您的问题中有两个问题 分割音频 提取特征 它们都有相同的基本关键信息:采样频率 音频信号的持续时间(以秒为单位)和用于音频文件的采样频率定义了音频文件的采样量。音频样本(简而言之)是硬盘或计算机内存中音频信号的一个值 典型wav文件的音频采样量根据公式sr*dur计算,此处sr是以Hz为单位的采样频率(例如,CD质量信号为

我有一些长音频文件。我想使用python将此音频文件拆分为多个短长度音频文件。例如:音频长长度超过1小时,希望拆分为多个短长度音频文件。我想在每个5s中提取整个音频文件的功能。

您的问题中有两个问题

  • 分割音频
  • 提取特征
  • 它们都有相同的基本关键信息:采样频率

    音频信号的持续时间(以秒为单位)和用于音频文件的采样频率定义了音频文件的采样量。音频样本(简而言之)是硬盘或计算机内存中音频信号的一个值

    典型wav文件的音频采样量根据公式
    sr*dur
    计算,此处
    sr
    是以Hz为单位的采样频率(例如,CD质量信号为44100),
    dur
    是音频文件的持续时间(以秒为单位)。例如,2秒的CD音频文件具有
    44100*2=88200
    样本

    因此:

    要在Python中分割音频文件,首先必须在变量中读取它。例如,有很多库和函数(以随机顺序排列):

    • scipy.io.wavfile.read
    • wave
      模块
    等等。有关读取wav文件的更多信息,请查看此项

    然后,您只需获取N个样本,例如
    my\u audio\u 1=整个\u audio\u文件[0:5*sr]

    但是

    如果您只想每X秒提取一次功能,则无需手动分割音频。大多数音频特征提取库都可以为您这样做


    例如,在
    librosa
    中,您可以控制FFT点的数量,这大致相当于要从中提取特征的音频长度。例如,您可以在此处查看:

    您可以查看下面的链接以获取所需内容。。