Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/performance/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Audio 在音频文件中搜索声音咬合的实例_Audio - Fatal编程技术网

Audio 在音频文件中搜索声音咬合的实例

Audio 在音频文件中搜索声音咬合的实例,audio,Audio,我有两个音频文件。一个持续约1秒,包含非常无聊的“嘟嘟”声,另一个持续约60分钟,充满随机声音(说话、噪音等)以及相同的“嘟嘟”声(注意:“嘟嘟”声可能与其他声音同时出现!) 有谁能给我一个简单的方法来编写一个程序,搜索60分钟的音频文件,并为它找到的每一个“哔”声实例返回一个时间戳?我一直在四处寻找如何做到这一点,但我很难弄清楚要搜索/阅读哪些术语 我希望使用Python,但我也愿意使用C、C++、java或(对我来说最明显的)MATLAB。请随意给我指点课本、概念或任何你认为可能有用的东西。

我有两个音频文件。一个持续约1秒,包含非常无聊的“嘟嘟”声,另一个持续约60分钟,充满随机声音(说话、噪音等)以及相同的“嘟嘟”声(注意:“嘟嘟”声可能与其他声音同时出现!)

有谁能给我一个简单的方法来编写一个程序,搜索60分钟的音频文件,并为它找到的每一个“哔”声实例返回一个时间戳?我一直在四处寻找如何做到这一点,但我很难弄清楚要搜索/阅读哪些术语

<>我希望使用Python,但我也愿意使用C、C++、java或(对我来说最明显的)MATLAB。请随意给我指点课本、概念或任何你认为可能有用的东西。我愿意做大量的学习来找出如何做到这一点。非常感谢您的帮助


编辑:标题为清晰起见

我想您必须将信号转换为频域(FFT),然后从头到尾读取声音,并搜索所需频率超过某个阈值的位置,然后查看它是否至少重复一秒钟。希望您的嘟嘟声足够大,这样阈值可以设置得足够高,声音不会与“背景”噪音和声音混淆。

您正在寻找的技术称为音频指纹。
如所述。

首先,您必须了解,您想要做的并不是一项简单易行的任务。这就像赋予计算机聆听和匹配声音的能力。让它以人类感知声音的方式来感知声音。您可以浏览某些开源项目以获取帮助。查找与本主题密切相关的一些开源项目的SouadID和chromaprint。

作为参考,声音几乎总是远远超过一个字节。你的意思可能是“声音叮咬”,这是一个短的声音。