Audio 我需要分析许多音频WAV文件的特征噪声,想法?

Audio 我需要分析许多音频WAV文件的特征噪声,想法?,audio,static,detection,detect,noise,Audio,Static,Detection,Detect,Noise,我需要能够分析(搜索)数以百计的WAV文件和检测,但不消除静态噪音。正如目前所做的那样,我必须聆听每一次对话,并手动查找特征噪音/静电,这需要花费太多的时间。理想情况下,我需要一个程序,可以读取每个新的WAV文件,并能够检测静态噪声的特征信号,如突发白噪声或完整音频带、高振幅噪声(如电话通话中的AM无线电噪声,如白噪声墙)或突发peek高频高振幅(如电话线上的噼啪声)在正常声音的背景下。我不需要消除噪音,只需检测噪音并标记录音,以便进一步排除故障。有什么想法 我可以听录音,发现静电或爆裂声,但这

我需要能够分析(搜索)数以百计的WAV文件和检测,但不消除静态噪音。正如目前所做的那样,我必须聆听每一次对话,并手动查找特征噪音/静电,这需要花费太多的时间。理想情况下,我需要一个程序,可以读取每个新的WAV文件,并能够检测静态噪声的特征信号,如突发白噪声或完整音频带、高振幅噪声(如电话通话中的AM无线电噪声,如白噪声墙)或突发peek高频高振幅(如电话线上的噼啪声)在正常声音的背景下。我不需要消除噪音,只需检测噪音并标记录音,以便进一步排除故障。有什么想法

我可以听录音,发现静电或爆裂声,但这需要时间。我需要一个自动或批处理过程,可以自己运行,并标记有问题的通话录音(电话PBX的WAV文件)。这些是SIP和模拟对话,取决于对话的分支,因此RTSP/SIP数据包分析可能是一个选项,但原始WAV文件是最简单的。我可以使用Audacity,但这仍然需要打开每个文件并查看音频的视觉表示,并且只比听每个c稍微快一点但仍然很麻烦

我目前没有这个任务的代码或方法。我只是简单地听每个调用wav文件来寻找噪音


我需要一个批量Wav文件搜索,该搜索可以呈现Wav文件录音,其中包含录音电话对话中的特征噪音或静电或爆裂声。

除非你能告诉程序噪音是什么样子,否则运行任何类型的批量处理都将是一个挑战。我曾面临类似的挑战,这是一个提示我将开发(免费和开源)软件,帮助用户进行音频探索、分析和信号分离:

  • 应用程序:
  • 文件:
  • 源代码:
本质上,它将音频视为二维散点图,而不仅仅是波形或频谱图中的“线性”。上传音频时,会发生以下情况:

  • 根据您设置的阈值检测OnSet(基于来自的高频内容算法)。如果需要全部,请将其设置为
    None
  • 每个音频片段,根据您的选择计算音频特征。没有通用的最佳特征集,都取决于应用程序。您可以尝试启动,例如“代码>音调统计< /代码>。考虑设置带通滤波器和样本长度的适当值(这是我们要使用的音频片段的长度)。。样本长度可以在将来动态建立。有关详细信息,请检查
  • 结果是,对于每个片段,您有许多特征,例如6或60。这意味着我们有
    k
    -维(其中
    k
    是特征数)结构,然后我们使用您选择的降维算法将其投影到2d空间。统一流形近似和投影是一个合理的选择
  • 理论上,产生的嵌入应该是相似的声音(根据我们选择的特征)紧密地结合在一起,而不同的声音则相距更远。你的噪声现在应该从你的“非噪声”中分离出来,形成集群
  • 当您将鼠标悬停在图形上方时,右上角会出现一组图标。其中一个是套索选择。使用它标记点,检查光谱图,例如下载具有描述该信号功能的表格。此时您还可以降低噪音(显示额外按钮)与Audacity类似,它分析频谱,并通过一些平滑处理降低这些频率
  • 它现在还不能完全解决您的问题,但可能会大大减少工作量。通过数百个WAV可能会占用您一天中的大部分时间,但您会完成的。是否希望实现自动化?有CLI(命令行界面)在不远的将来,它应该把你标记为噪声和信号的东西,然后使用有监督的机器学习以批处理的方式完成所有的事情


    建议/反馈?在上发表一个问题。

    非常好的反馈,谢谢。我将对此进行探讨。非常感谢。@James很高兴听到。如果答案有帮助,请接受/投票(我还提到了您提出的其他问题)