Audio 开源音频模式识别（指纹）_Audio_Pattern Recognition_Audio Fingerprinting

Audio 开源音频模式识别（指纹）

audio

Audio 开源音频模式识别（指纹）,audio,pattern-recognition,audio-fingerprinting,Audio,Pattern Recognition,Audio Fingerprinting,是否有任何开源音频指纹解决方案可以提供“类似Shazam”的解决方案使用来自的商业解决方案，但我正在寻找替代方案（即使精度和性能较差）开源解决方案有人知道这种实现，甚至知道一个已发布的未实现算法吗好的。不同的搜索关键字，所有我搜索的结果感谢您收看看起来是商业LIB的可靠替代品对于语音识别：我们只测试了echoprint，目前为止效果良好我知道答案有点晚，但随着这个页面在谷歌上弹出，我们不妨随着时间的推移进行改进：）由于CMU是面向语音的尽管您可能会忘记商业音频识别服

是否有任何开源音频指纹解决方案可以提供“类似Shazam”的解决方案

使用来自的商业解决方案，但我正在寻找替代方案（即使精度和性能较差）开源解决方案

有人知道这种实现，甚至知道一个已发布的未实现算法吗

好的。不同的搜索关键字，所有我搜索的结果

感谢您收看

看起来是商业LIB的可靠替代品

对于语音识别：

我们只测试了echoprint，目前为止效果良好

我知道答案有点晚，但随着这个页面在谷歌上弹出，我们不妨随着时间的推移进行改进：）

由于CMU是面向语音的

尽管您可能会忘记商业音频识别服务（如Shazam、SoundHound等）的质量/性能，但仍有一些开源音频识别项目存在。这还取决于您想要进行何种识别（音频文件指纹识别/标记、实时识别、OTA（空中）识别等）

opensurce

提供执行音频指纹和元数据关联（指纹识别器和服务器）的工具。您可以建立自己的指纹/元数据服务器或使用MusicBrainz的服务。音频文件指纹识别和识别的良好解决方案，不适用于实时高性能应用程序（即OTA）。我们也测试了它的音频流监控（广播监控），但结果很差
提供与声学ID（指纹识别器和服务器+元数据）相同的工具，也可用于音频流监控，因为它可以以相当高的精度识别音频中任何地方的片段（但我不会将其用于严肃的商业应用）他们还声称它适用于OTA应用，但性能不适合生产使用
Last.fm并非完全开源，尽管他们已经将指纹识别模块开源。您必须查询他们的身份识别和元数据提供商服务，因为他们没有提供全面的解决方案

如果您正在寻找JAVA库，那么请选择MusicG，我在过去的一个项目中使用过它，它工作正常。

如果要在.NET中查找解决方案，请检查库

它是开源的，建立在使用小波研究论文的内容指纹之上

该算法与Shazaam的算法不同，但总体思路相似：从光谱中提取最显著的系数，然后使用它们构建指纹供以后检索

可以找到算法说明。

语音识别：echoprint url已更新。谢谢@SarveshMishrado您知道如何使用SQL server作为永久存储吗？