Audio 将语音输入与现有音频源进行比较

Audio 将语音输入与现有音频源进行比较,audio,spectrum,Audio,Spectrum,我目前正在为一个脚本创建一个配方,该脚本可以将音频输入与现有音频源进行比较,并返回匹配结果 这个想法是语音输入不能转换成文本。这些将是人声,如狗汪汪或猫喵喵声输入 最后,我想让脚本得出结论,输入是猫或狗的声音,还是两者都不是 我知道需要对声音输入低通进行预处理;降噪等,然后对声音进行频谱分析,然后将其与现有的DB频谱分析进行比较,但我不知道从哪里开始 对于这种小型项目,有没有可以提供帮助的库? 如何比较频谱分析? 频谱分析对比如何考虑两个不同的人发出相同喵喵叫声的可能性?它是否考虑到匹配到特定的

我目前正在为一个脚本创建一个配方,该脚本可以将音频输入与现有音频源进行比较,并返回匹配结果

这个想法是语音输入不能转换成文本。这些将是人声,如狗汪汪或猫喵喵声输入

最后,我想让脚本得出结论,输入是猫或狗的声音,还是两者都不是

我知道需要对声音输入低通进行预处理;降噪等,然后对声音进行频谱分析,然后将其与现有的DB频谱分析进行比较,但我不知道从哪里开始

对于这种小型项目,有没有可以提供帮助的库? 如何比较频谱分析? 频谱分析对比如何考虑两个不同的人发出相同喵喵叫声的可能性?它是否考虑到匹配到特定的浇灌?
谢谢你对这件事的指导。

这类事情实际上是当前研究的一个非常大的领域。从本质上说,很难弄清楚是什么让树皮发出声音,以及声音的哪些特性最有用。直接光谱比较通常不是结果,因为听起来相似的东西可能有比你想象的更大的差异。这也带来了对齐的问题——声音的长度必须相同,开头必须对齐。这里有两个可能相关的链接:,