Speech recognition 应急无线电录音的语音识别

Speech recognition 应急无线电录音的语音识别,speech-recognition,Speech Recognition,语音识别的新手,请原谅我的无知。我在找一份紧急广播的记录。显然,我做错了什么,因为没有任何先进的ASR(自动语音识别)工具可以从中获得任何意义 我试过了,甚至试过了。他们中没有人能从音频中收集到最基本的信息 这是一个由两部分组成的问题。上述示例中的音频是否可以通过ASR工具使用?在通过API发送之前,我是否应该进行一些转换 上述示例中的音频是否可以通过ASR工具使用 是的,你可以非常可靠地识别这些东西,但是你必须建立一个定制的ASR系统,因为传统的ASR系统不能处理这样的音频质量 在通过API发

语音识别的新手,请原谅我的无知。我在找一份紧急广播的记录。显然,我做错了什么,因为没有任何先进的ASR(自动语音识别)工具可以从中获得任何意义

我试过了,甚至试过了。他们中没有人能从音频中收集到最基本的信息

这是一个由两部分组成的问题。上述示例中的音频是否可以通过ASR工具使用?在通过API发送之前,我是否应该进行一些转换

上述示例中的音频是否可以通过ASR工具使用

是的,你可以非常可靠地识别这些东西,但是你必须建立一个定制的ASR系统,因为传统的ASR系统不能处理这样的音频质量

在通过API发送之前,我是否应该进行一些转换

不,使用专门针对特定类型的数据训练的专门模型会更有效率

Cobalt可以为您构建一个定制的解决方案。您可以使用像Kaldi这样的开源工具包自己构建模型。另一家公司检查这种音频的专门解决方案是,他们在机场塔楼工作,所以有类似类型的音频

对于这一主题的研究,你可以查看关于定制的项目


您还需要付出更多的努力来获得更高质量的音频。

您了解语音识别的工作原理吗?太棒了!虽然看起来我的工作很适合我,但这正是我需要知道的。