Audio 如何检测音频文件中的静音?

Audio 如何检测音频文件中的静音?,audio,media,Audio,Media,我正在开发一个在浏览器中编辑.srt字幕文件的工具。该工具将用于语言注释。在用于类似目的的桌面工具中,用户可以访问波形,并可以查看信号中的静音位置,从而选择特定短语进行转录 比如说,这样一个工具可以在未来的浏览器中使用Web Workers和Canvas构建,但目前,要想找到这些沉默,需要进行那种信号处理是不可行的 所以,我在考虑下一个最好的方法:我可以使用什么免费工具来生成一个时间戳列表,列出某个给定阈值以下的静音开始和停止的位置?如果我离线生成这样一个列表,并将其与音频文件一起上传,那么我至

我正在开发一个在浏览器中编辑.srt字幕文件的工具。该工具将用于语言注释。在用于类似目的的桌面工具中,用户可以访问波形,并可以查看信号中的静音位置,从而选择特定短语进行转录

比如说,这样一个工具可以在未来的浏览器中使用Web Workers和Canvas构建,但目前,要想找到这些沉默,需要进行那种信号处理是不可行的

所以,我在考虑下一个最好的方法:我可以使用什么免费工具来生成一个时间戳列表,列出某个给定阈值以下的静音开始和停止的位置?如果我离线生成这样一个列表,并将其与音频文件一起上传,那么我至少可以浏览定义为非静默期的短语。我认为这仍然是一个胜利的生产力做转录

Audacity可以做到这一点,但AFAICT只有在安装Nyquist的情况下才能做到,Nyquist似乎有一些专利问题

还有其他选择吗


如果该工具能够处理尽可能多的ogg、mp3和wav文件,那就太好了。

我已经用Java对mp3和wav进行了波形分析。虽然不是小事,但也没那么糟糕。如果内存可用,我认为Java声音是您想要的API。还有什么专利问题?为什么这会阻止你使用它?谢谢yar和endolith。我现在明白了,我对奈奎斯特的专利问题是错误的;显然,它附带了Audacity,并且有一个现有的插件:我的误解是因为我不久前在Audacity中在irc上的一次对话造成的。我想情况已经改变了;对不起,误会了。