Audio 在音频文件中搜索声音咬合的实例_Audio

Audio 在音频文件中搜索声音咬合的实例

audio

Audio 在音频文件中搜索声音咬合的实例,audio,Audio,我有两个音频文件。一个持续约1秒，包含非常无聊的“嘟嘟”声，另一个持续约60分钟，充满随机声音（说话、噪音等）以及相同的“嘟嘟”声（注意：“嘟嘟”声可能与其他声音同时出现！）有谁能给我一个简单的方法来编写一个程序，搜索60分钟的音频文件，并为它找到的每一个“哔”声实例返回一个时间戳？我一直在四处寻找如何做到这一点，但我很难弄清楚要搜索/阅读哪些术语我希望使用Python，但我也愿意使用C、C++、java或（对我来说最明显的）MATLAB。请随意给我指点课本、概念或任何你认为可能有用的东西。

我有两个音频文件。一个持续约1秒，包含非常无聊的“嘟嘟”声，另一个持续约60分钟，充满随机声音（说话、噪音等）以及相同的“嘟嘟”声（注意：“嘟嘟”声可能与其他声音同时出现！）

有谁能给我一个简单的方法来编写一个程序，搜索60分钟的音频文件，并为它找到的每一个“哔”声实例返回一个时间戳？我一直在四处寻找如何做到这一点，但我很难弄清楚要搜索/阅读哪些术语

<>我希望使用Python，但我也愿意使用C、C++、java或（对我来说最明显的）MATLAB。请随意给我指点课本、概念或任何你认为可能有用的东西。我愿意做大量的学习来找出如何做到这一点。非常感谢您的帮助

编辑：标题为清晰起见

我想您必须将信号转换为频域（FFT），然后从头到尾读取声音，并搜索所需频率超过某个阈值的位置，然后查看它是否至少重复一秒钟。希望您的嘟嘟声足够大，这样阈值可以设置得足够高，声音不会与“背景”噪音和声音混淆。

您正在寻找的技术称为音频指纹。

如所述。

首先，您必须了解，您想要做的并不是一项简单易行的任务。这就像赋予计算机聆听和匹配声音的能力。让它以人类感知声音的方式来感知声音。您可以浏览某些开源项目以获取帮助。查找与本主题密切相关的一些开源项目的SouadID和chromaprint。

作为参考，声音几乎总是远远超过一个字节。你的意思可能是“声音叮咬”，这是一个短的声音。