Audio 检测音频流中的广告?

Audio 检测音频流中的广告?,audio,streaming,video-streaming,audio-streaming,audio-recording,Audio,Streaming,Video Streaming,Audio Streaming,Audio Recording,我从未尝试过,只是好奇是否有可能检测到音频流中的广告?我是说除了机器学习之类的。广告期间有关字节流的一些细节。可能是不同的音量?从纯音频的角度来看,这是不可能的。广告和其他音频内容之间没有区别。当然,你可能会说播放音乐的电视台与播放广告的电视台会有不同的光谱特征,但同时播放音乐的广告又如何呢?你如何区分播音员和阅读广告的人?如果广告嵌入了正常的内容怎么办 现在,一些电台确实提供元数据,其中偶尔包含广告信息。如果你看一个特定内容项目的长度,你的广告通常会在一分钟或30秒以下。如何获取和处理这些元数

我从未尝试过,只是好奇是否有可能检测到音频流中的广告?我是说除了机器学习之类的。广告期间有关字节流的一些细节。可能是不同的音量?

从纯音频的角度来看,这是不可能的。广告和其他音频内容之间没有区别。当然,你可能会说播放音乐的电视台与播放广告的电视台会有不同的光谱特征,但同时播放音乐的广告又如何呢?你如何区分播音员和阅读广告的人?如果广告嵌入了正常的内容怎么办


现在,一些电台确实提供元数据,其中偶尔包含广告信息。如果你看一个特定内容项目的长度,你的广告通常会在一分钟或30秒以下。如何获取和处理这些元数据取决于您使用的流的类型。

有一些技术正在出现,它们倾向于利用已知广告的数据库来绕过Brad在回答中正确强调的理论问题

然而,下面的参考文献之一使用了一种基于在ad启动时检测音频中的细微差异作为初始检测触发器的技术

一些技术还使用音频和视频流来辅助检测——例如,下面的谷歌论文首先使用音频匹配,然后使用视频来验证

对于任何对这一领域感兴趣的人来说,一些来源可能值得一看(我意识到这是一个老问题,但仍然是热门话题):