Audio Verizon SongID-它是如何编程的?

Audio Verizon SongID-它是如何编程的?,audio,audio-processing,audio-fingerprinting,audio-analysis,Audio,Audio Processing,Audio Fingerprinting,Audio Analysis,对于任何不熟悉Verizon的SongID程序的人来说,它是一个可以通过Verizon的VCast网络下载的免费应用程序。它在歌曲播放过程中的任何时候都会收听歌曲10秒钟,然后将这些数据发送给某个无所不知的算法怪兽,该怪兽会将其咀嚼并将所有ID3标签(艺术家、专辑、歌曲等)发回给您 前两部分和最后一部分都很简单,但在录制的声音发送后的处理过程中会发生什么 我认为它必须获取声音文件(什么格式?),解析(如何?使用什么?)一些关键标识符(这些是什么?波函数的常规属性?相位/位移/振幅等),并对照数据

对于任何不熟悉Verizon的SongID程序的人来说,它是一个可以通过Verizon的VCast网络下载的免费应用程序。它在歌曲播放过程中的任何时候都会收听歌曲10秒钟,然后将这些数据发送给某个无所不知的算法怪兽,该怪兽会将其咀嚼并将所有ID3标签(艺术家、专辑、歌曲等)发回给您

前两部分和最后一部分都很简单,但在录制的声音发送后的处理过程中会发生什么

我认为它必须获取声音文件(什么格式?),解析(如何?使用什么?)一些关键标识符(这些是什么?波函数的常规属性?相位/位移/振幅等),并对照数据库进行检查

我在网上找到的关于这个如何工作的所有东西都是我上面键入的东西

此服务基于 复杂的音频识别 结合高级音频的算法 指纹识别技术及其应用 歌曲数据库。当你上传一个 音频文件,正在由 音频引擎。在分析过程中 提取音频“指纹”并 通过将其与 音乐数据库。完成时 这个识别过程,信息 关于歌曲及其匹配 概率显示在屏幕上


所有这些服务都是通过从客户端的采样音频数据中提取“指纹”,将其发送到服务器,并将其与指纹数据库进行比较来实现的


的一位开发者写了一篇关于这项技术如何工作的非常翔实的文章。这将为您提供所需的所有信息。

这就是我要找的-您搜索了什么,在哪里搜索的?很好,我去年读过。这是我感兴趣的一个领域,因为我在使用类似的技术。@Stu-(快速阅读后)没有具体提到它在什么环境下运行。。。如果您有任何想法,请在回答中添加您认为处理这些规范的最佳环境。为了提高速度,客户机和服务器组件几乎肯定应该使用C/C++编写。操作系统并不重要。查看快速开源FFT实现。请记住,这些算法包含在多项专利中。此外,它看起来像是时间与频率的函数——当输出和输入源距离/位置/阻塞发生变化(多普勒/相位)时,两者都会失真——似乎不是一个好的“指纹”