Audio 将语音输入与现有音频源进行比较_Audio_Spectrum

Audio 将语音输入与现有音频源进行比较

audio

Audio 将语音输入与现有音频源进行比较,audio,spectrum,Audio,Spectrum,我目前正在为一个脚本创建一个配方，该脚本可以将音频输入与现有音频源进行比较，并返回匹配结果这个想法是语音输入不能转换成文本。这些将是人声，如狗汪汪或猫喵喵声输入最后，我想让脚本得出结论，输入是猫或狗的声音，还是两者都不是我知道需要对声音输入低通进行预处理；降噪等，然后对声音进行频谱分析，然后将其与现有的DB频谱分析进行比较，但我不知道从哪里开始对于这种小型项目，有没有可以提供帮助的库？如何比较频谱分析？频谱分析对比如何考虑两个不同的人发出相同喵喵叫声的可能性？它是否考虑到匹配到特定的

我目前正在为一个脚本创建一个配方，该脚本可以将音频输入与现有音频源进行比较，并返回匹配结果

这个想法是语音输入不能转换成文本。这些将是人声，如狗汪汪或猫喵喵声输入

最后，我想让脚本得出结论，输入是猫或狗的声音，还是两者都不是

我知道需要对声音输入低通进行预处理；降噪等，然后对声音进行频谱分析，然后将其与现有的DB频谱分析进行比较，但我不知道从哪里开始

对于这种小型项目，有没有可以提供帮助的库？如何比较频谱分析？频谱分析对比如何考虑两个不同的人发出相同喵喵叫声的可能性？它是否考虑到匹配到特定的浇灌？

谢谢你对这件事的指导。

这类事情实际上是当前研究的一个非常大的领域。从本质上说，很难弄清楚是什么让树皮发出声音，以及声音的哪些特性最有用。直接光谱比较通常不是结果，因为听起来相似的东西可能有比你想象的更大的差异。这也带来了对齐的问题——声音的长度必须相同，开头必须对齐。这里有两个可能相关的链接：，