Audio python中音频文件的信号处理

Audio python中音频文件的信号处理,audio,aiff,Audio,Aiff,我打算在未压缩的AIFF音频文件中进行静音检测。我更喜欢用Python来做,但是如果这是非常低效的,我会考虑其他的选择。我正在处理的未压缩文件预计为20MB(最大大小) 我能理解信号处理的基础知识,但我不是这方面的专家 语言不可知伪代码: 对于每个时间窗口(例如10毫秒) 计算时间窗口中的RMS功率 静音=均方根功率

我打算在未压缩的AIFF音频文件中进行静音检测。我更喜欢用Python来做,但是如果这是非常低效的,我会考虑其他的选择。我正在处理的未压缩文件预计为20MB(最大大小)


我能理解信号处理的基础知识,但我不是这方面的专家

语言不可知伪代码:

  • 对于每个时间窗口(例如10毫秒)
    • 计算时间窗口中的RMS功率
    • 静音=均方根功率<静音阈值
要计算RMS功率,请执行以下操作:

  • sum_sq=0
  • 对于N样本窗口中的每个样本
    • sum_sq+=样本^2
  • 均方根功率=sqrt(平方和/N)

您可能还想添加进一步的检测层,例如,确定静默=M个连续的静默窗口,其中M确定静默需要多长时间才能算作实际静默。

您真幸运!该库似乎足以支持解决您的问题。

让我试试这个。使用afic库,我可以一次读取一个帧(我不认为我可以读取原始字节),然后计算RMS并完成其余的工作。